你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是 Azure 机器学习中的设计器 (v1)?

Azure 机器学习设计器是一个拖放界面,用于在 Azure 机器学习工作室中训练和部署模型。 本文介绍可在设计器中执行的任务。

重要

Azure 机器学习中的设计器支持两种类型的管道,这些管道使用经典预生成 (v1) 或自定义 (v2) 组件。 这两种组件类型在管道中不兼容,设计器 v1 与 CLI v2 和 SDK v2 不兼容。 本文适用于使用经典预生成 (v1) 组件的管道

  • 经典预生成组件 (v1) 包括典型数据处理和机器学习任务,例如回归和分类。 Azure 机器学习继续支持现有的经典预生成组件,但不会添加新的预生成组件。 此外,经典预生成 (v1) 组件的部署不支持托管联机终结点 (v2)。

  • 自定义组件 (v2) 允许你将自己的代码包装为组件,从而在 Azure 机器学习工作室、CLI v2 和 SDK v2 界面之间实现跨工作区共享和无缝创作。 最好为新项目使用自定义组件,因为它们与 Azure 机器学习 v2 兼容,并继续接收新更新。 有关自定义组件和设计器 (v2) 的详细信息,请参阅 Azure 机器学习设计器 (v2)

下面的 GIF 动画演示了如何在设计器中通过拖放资产并连接它们来以可视化方式构建管道。

在设计器中生成管道的 GIF。

若要了解设计器中可用的组件,请参阅算法和组件参考。 若要开始使用设计器,请参阅教程:训练无代码回归模型

模型训练和部署

设计器使用 Azure 机器学习工作区来整理共享资源,例如:

下图演示了如何使用设计器生成端到端机器学习工作流。 可以在设计器界面中训练、测试和部署模型。

设计器中的训练、批量推理和实时推理的工作流关系图。

  • 数据资产组件拖放到设计器视觉对象画布上,然后连接组件以创建管道草稿
  • 提交使用 Azure 机器学习工作区中的计算资源的管道作业
  • 将训练管道转换为推理管道 。
  • 将管道发布到 REST 管道终结点,以提交使用不同参数和数据资产运行的新管道
    • 发布训练管道,以便在更改参数和数据资产时重用单个管道训练多个模型。
    • 发布批量推理管道,通过使用以前训练的模型针对新数据进行预测。
  • 将实时推理管道部署到联机终结点,以便对新数据进行实时预测。

数据

使用机器学习数据资产可以轻松地访问和处理数据。 此设计器中包含多个示例数据资产供你用于试验。 你可以根据需要注册更多数据资产。

组件

组件是可对数据运行的算法。 设计器有多个组件,范围从数据引入函数到训练、评分和验证过程。

组件可能提供可用于配置组件的内部算法的参数。 在画布上选择组件时,组件的参数和其他设置会显示在画布右侧的“属性”窗格中。 可以在该窗格中修改参数和设置各个组件的计算资源。

显示组件属性的屏幕截图。

有关可用机器学习算法库的详细信息,请参阅算法和组件参考。 有关选择算法的帮助,请参阅 Azure 机器学习算法速查表

管道

管道包含连接的数据资产和分析组件。 管道有助于重复使用你的工作并组织你的项目。

管道有许多用途。 可以创建具有以下用途的管道:

  • 训练单个模型。
  • 训练多个模型。
  • 实时或批量进行预测。
  • 仅清除数据。

管道草稿

在设计器中编辑管道时,你的进度会保存为管道草稿。 可以通过添加或删除组件、配置计算目标或设置参数,随时编辑管道草稿。

有效的管道具有以下特征:

  • 数据资产只能连接到组件。
  • 组件只能连接到数据资产或其他组件。
  • 组件的所有输入端口必须与数据流建立某种连接。
  • 必须设置每个组件的所有必需参数。

准备好运行管道草稿后,保存管道并提交管道作业。

管道作业

每次运行管道时,管道及其结果的配置都作为管道作业存储在工作区中。 管道作业将分组到试验,以便对作业历史记录进行组织。

出于故障排除或审核目的,可以返回任何管道作业以对其进行检查。 克隆管道作业可创建新的管道草稿以供编辑

计算资源

计算目标会附加到 Azure 机器学习工作室中的 Azure 机器学习工作区。 使用工作区中的计算资源来运行管道,并将已部署的模型作为联机终结点或管道终结点进行托管,以便用于批量推理。 支持的计算目标如下所示:

计算目标 培训 部署
Azure 机器学习计算
Azure Kubernetes 服务 (AKS)

部署

若要执行实时推理,必须将管道部署为联机终结点。 联机终结点在外部应用程序和评分模型之间创建接口。 该终结点基于 REST,这是一种流行的 Web 编程项目的体系结构。 对联机终结点的调用会将预测结果实时返回给应用程序。

若要调用联机终结点,需要传递在部署终结点时创建的 API 密钥。 必须将联机终结点部署到 AKS 群集。 若要了解如何部署模型,请参阅教程:使用设计器部署机器学习模型

发布

还可以将管道发布到管道终结点。 与联机终结点类似,管道终结点允许你使用 REST 调用从外部应用程序提交新的管道作业。 但是,无法使用管道终结点实时发送或接收数据。

已发布的管道终结点是灵活的,可用于训练或重新训练模型、执行批量推理或处理新数据等。 可以将多个管道发布到单个管道终结点,并指定要运行的管道版本。

已发布的管道在每个组件的管道草稿中定义的计算资源上运行。 设计器创建与 SDK 相同的 PublishedPipeline 对象。