什么是 Azure 机器学习?
Azure 机器学习是一种用于创建和管理机器学习系统端到端生命周期的平台。 Azure 机器学习与平台无关,可让你灵活使用喜欢的技术,如 TensorFlow、PyTorch、ONNX、MLFlow 和 Scikit-learn。
Azure 机器学习使熟悉机器学习框架的用户能够使用代码快速训练和部署模型,同时为其他人提供强大的可视化工具。 你所有的训练脚本、模型、日志和计算都集中在 Azure 机器学习的共享工作区中,这有助于生成和部署机器学习系统的每一步,意味着你可以专注于模型,而 Azure 机器学习则会执行其余工作。
Azure 机器学习拥有一套全面的功能,支持数据和模型的记录、监视和管理,确保模型按预期执行,并有效地传达给利益干系人。
什么是 Azure 机器学习工作室?
Azure 机器学习工作室是一个基于浏览器的服务,提供无代码和代码优先的解决方案,通过 Web UI 对模型进行可视化创建、训练和管理。 Azure 机器学习工作室让 Python SDK 与原生支持的 Jupyter Notebook 无缝集成,以实现协作注释和编码。 通过直观的数据可视化效果和 AI 辅助图像或文本标记功能,轻松对 Azure 机器学习工作室内的数据进行管理。
创建模型
可以通过多种方式在 Azure 机器学习中创建模型。 训练可以在本地计算机或 Azure 云上进行,例如虚拟机或计算群集。
使用 Python 编写代码
通过适用于 Python 的 Azure 机器学习 SDK,你可以从多个环境(包括 Jupyter Notebook)中与服务进行交互。 Notebook 提供可运行代码、可视化效果和注释的协作环境。 工作室中包含可用于开始使用 Azure 机器学习的示例笔记本。
自动化 ML
自动化机器学习 (AutoML) 自动创建最佳机器学习模型,帮助用户找到其数据的最佳模型(无论其数据科学专业知识如何)。 AutoML 专用于分类、回归和时序预测,根据任务对不同的功能、算法和参数进行试验,然后为模型提供它认为最合适的分数。 然后,可以按原样部署这些模型,或将其导出为可在各种平台和设备上运行的 ONNX 格式。 AutoML 的多功能性和速度意味着它经常被经验丰富的数据科学家和新手数据科学家用作起点。
可以在 Azure 机器学习工作室中或通过 Python SDK 使用 AutoML。
在下图中,我们可以看到 AutoML 管道构建和推荐模型的概述。
Designer
如果你更喜欢无代码选项,Azure 机器学习工作室内的 Azure 机器学习设计器会为你提供具有拖放控件的可视化画布,以操作数据集和模块。Azure 机器学习设计器中的模块是具有一系列目的的算法,从数据入口函数到训练、评分和验证过程。 这些链接模块创建有效的 ML 管道来构建、测试和部署 ML 模型,如下示例所示。
计算
可以通过 Azure 机器学习分配或附加机器学习环境所需的计算资源。 从为 Jupyter 笔记本提供支持以进行探索数据分析的计算,到用于训练的群集以及将部署到用于大规模生产推理的托管终结点,这一切都可通过 Azure 机器学习进行创建和管理。
管理数据
通过 Azure 机器学习,可简化数据准备和引入的耗时过程并协同工作。 该平台与 Azure Synapse、Azure Databricks、和其他一套 Azure 服务集成,以协助数据工程管道将原始数据提取、转换和加载 (ETL) 到数据存储。
数据存储和标记
Azure 机器学习安全地将原始数据存储在数据存储中,这样便不必依赖于脚本的外部源,并且可在没有原始数据完整性风险的情况下对训练集进行试验。 存储后,你可对数据进行清理、转换和标记,以从数据存储创建训练集。 Azure 机器学习提供可帮助标记表格、图像和文本数据的工具,并内置机器学习系统,该系统建议标签或完全自动完成数据标记。 以下示例显示在 Azure 机器学习工作室中进行的人为多标签分类项目。
MLOps
所有模型(包括那些部署时完美运行的模型)都需要随着时间推移进行监视和重新训练,以保持高性能。 Azure 机器学习提供机器学习操作 (MLOps) 功能,为数据准备、训练、评分和可重用的软件环境创建可重复的步骤,便于部署。 这些可重复的管道和环境为机器学习工作流程提供了持续集成/持续交付 (CI/CD) 体验。
除了这些功能,Azure 机器学习还提供 MLOps 监视工具,用于向你通知机器学习生命周期内的事件,甚至对这些事件做出反应。 通过此控制,你可以快速识别和响应降低的模型性能或数据集内的问题。 Azure 机器学习内还提供管理信息,以便你可以查看完整的运行历史记录,并在模型生命周期内跟踪团队成员的操作。