简介
由于有更多可用数据,实现了计算能力的民主化并改进了用于训练模型的算法,因此整个组织中的机器学习项目有所增加。
但是,采用和缩放机器学习项目时的主要障碍之一是缺乏明确的策略和组织孤岛。
MLOps
机器学习操作或 MLOps 旨在更有效地从概念证明或试点项目扩展到生产中的机器学习工作负载。
实现 MLOps 有助于使机器学习工作负载可靠且可重现。 例如,你将能够在始终将模型保留在生产环境中时根据需要监视、重新训练和重新部署模型。
MLOps 的目的是使机器学习生命周期可缩放:
- 定型模型
- 打包模型
- 验证模型
- 部署模型
- 监视模型
- 重新训练模型
MLOps 需要多个角色和多个工具。 数据科学家通常专注于与训练模型相关的所有任务,也称为“内部循环”。
为了打包和部署模型,数据科学家可能需要机器学习工程师的帮助,他们应用 DevOps 做法来缩放机器学习模型。
采用经过训练的模型并将其部署到生产环境通常称为“外部循环”。 在外部循环中,模型已打包、验证、部署和监视。 确定需要重新训练模型时,返回到内部循环以对模型进行更改。
DevOps
使用敏捷规划等 DevOps 原则可以帮助团队组织你的工作并更快地生成可交付结果。 使用源代码管理,可以促进项目协作。 使用自动化,可以加速机器学习生命周期。
本模块将介绍这些 DevOps 原则,并重点介绍常用的两个工具:Azure DevOps 和 GitHub。
学习目标
本模块介绍了以下内容:
- 为什么 DevOps 对机器学习项目很有用。
- 哪些 DevOps 原则可以应用于机器学习项目。
- 如何将 Azure DevOps 和 GitHub 与 Azure 机器学习联系起来。