介绍
由于有更多的数据可用、计算能力民主化以及用于训练模型的算法的进步,整个组织的机器学习项目有所增加。
但是,采用和缩放机器学习项目时的主要障碍之一是缺乏明确的策略和组织孤岛。
MLOps
机器学习操作 或 MLOps 旨在更有效地从概念证明或试点项目扩展到生产中的机器学习工作负载。
实现 MLOps 有助于使机器学习工作负载可靠且可重现。 例如,你可以在需要时监视、重新训练和重新部署模型,同时始终将模型保留在生产环境中。
MLOps 的目的是使机器学习生命周期可缩放:
- 训练模型
- 包模型
- 验证模型
- 部署模型
- 显示器型号
- 重新训练模型
MLOps 需要多个角色和多个工具。 数据科学家通常专注于与训练模型相关的所有任务,也称为 内循环。
为了打包和部署模型,数据科学家可能需要 机器学习工程师的帮助, 应用 DevOps 实践 来缩放机器学习模型。
采用训练的模型并将其部署到生产环境通常称为 外部循环。 在外部循环中,模型已打包、验证、部署和监视。 确定需要重新训练模型时,请返回到内部循环,对模型进行更改。
DevOps
使用 DevOps 原则(如 敏捷规划 可以帮助团队组织工作并更快地生成可交付结果。 使用 源代码管理,可以促进项目协作。 借助 自动化 可以加速机器学习生命周期。
本模块将介绍这些 DevOps 原则,并重点介绍常用的两种工具:Azure DevOps 和 GitHub。
学习目标
在本模块中,你将了解:
- 为什么 DevOps 对机器学习项目很有用。
- 哪些 DevOps 原则可以应用于机器学习项目。
- 如何将 Azure DevOps 和 GitHub 与 Azure 机器学习连接。