介绍
Azure 机器学习是用于管理机器学习项目的生命周期的云服务。 机器学习专业人员、数据科学家和工程师可以使用 Azure 机器学习来训练和部署模型和管理机器学习作。
当任何人监视 Azure 机器学习环境时,请务必了解可能影响性能和 AI 模型质量的所有资源。 Azure 机器学习的监视包括以下方面:
- Azure 机器学习性能:计算资源提供用于运行机器学习工作流的基础结构。 它们可能会影响 Azure 机器学习运行、试验和整体性能。 此区域传统上适用于操作员和管理员。
- 工作流问题:在整个机器学习生命周期内,新模型部署、作业运行期间或其他情况下可能会出现问题和错误。 管理员和机器学习专业人员可能对此领域感兴趣。
- 机器学习模型:数据偏移、模型预测偏移、数据质量差和特征归因偏差可能导致模型过时,导致 AI 系统过时。 机器学习专业人员和数据科学家是这种监视的传统所有者。
Azure Monitor 是用于管理 Azure 机器学习环境的主要工具。 Azure Monitor 提供内置功能,用于监视 Azure 机器学习中的性能和工作流问题。 还可以扩展这些功能以满足自己的需求。
AI 模型管理依赖于收集生产中的推理数据。 此分析是监视 Azure 机器学习模型的一部分。