你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

从工作室(经典版)迁移到 Azure 机器学习

重要

对机器学习工作室(经典版)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

2021 年 12 月之后,无法再创建新的工作室(经典版)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的工作室(经典版)资源。

工作室(经典版)文档即将停用,未来可能不再更新。

了解如何从机器学习工作室(经典版)迁移到 Azure 机器学习。 Azure 机器学习提供了一个现代化的数据科学平台,该平台将无代码和代码优先方法相结合。

本指南将介绍基本的直接迁移过程。 若要优化现有的机器学习工作流或实现机器学习平台的现代化,请参阅 Azure 机器学习采用框架以获得更多资源,包括数字调查工具、工作表和计划模板。

Azure 机器学习采用框架示意图。

请与云解决方案架构师合作进行迁移。

若要迁移到 Azure 机器学习,我们建议采用以下方法:

  • 步骤 1:评估 Azure 机器学习
  • 步骤 2:定义策略和计划
  • 步骤 3:重新生成试验和 Web 服务
  • 步骤 4:集成客户端应用
  • 步骤 5:清理工作室(经典)资产
  • 步骤 6:查看并扩展方案

步骤 1:评估 Azure 机器学习

  1. 了解 Azure 机器学习及其优势、成本和体系结构。

  2. 将 Azure 机器学习和工作室(经典)的功能进行比较。

    下表总结主要区别。

    功能 工作室(经典版) Azure 机器学习
    拖放界面 经典体验 更新的体验:Azure 机器学习设计器
    代码 SDK 不支持 Azure 机器学习 PythonR SDK 完全集成
    试验 可缩放(10 GB 训练数据限制) 使用计算目标进行缩放
    训练计算目标 专用计算目标,仅限 CPU 支持 各种可自定义的训练计算目标;包括 GPU 和 CPU 支持
    部署计算目标 专用 Web 服务格式,不可自定义 各种可自定义的部署计算目标;包括 GPU 和 CPU 支持
    机器学习管道 不支持 生成灵活的模块化管道,用于自动完成工作流
    MLOps 基本模型管理和部署;仅限 CPU 的部署 实体版本控制(模型、数据、工作流)、工作流自动化、与 CICD 工具集成、CPU 和 GPU 部署,等等
    模型格式 专用格式,仅限工作室(经典) 多个受支持的格式,具体取决于训练作业类型
    自动化模型训练和超参数优化 不支持 支持

    代码优先和无代码选项
    数据偏移检测 不支持 支持
    数据标签项目 不支持 支持
    基于角色的访问控制 (RBAC) 仅“参与者”和“所有者”角色 灵活的角色定义和 RBAC 控制
    AI 库 支持 不支持

    通过示例 Python SDK 笔记本进行了解

    注意

    Azure 机器学习中的设计器功能提供与工作室(经典版)类似的拖放体验。 但是,Azure 机器学习还提供了可靠的代码优先工作流作为替代方法。 此迁移系列重点介绍了设计器,因为它与工作室(经典)体验最为相似。

  3. 验证你的关键工作室(经典)模块在 Azure 机器学习设计器中是否受支持。 有关详细信息,请参阅工作室(经典)和设计器组件映射表。

  4. 创建 Azure 机器学习工作区

步骤 2:定义策略和计划

  1. 定义业务理由和预期的成果。

  2. 让可操作的 Azure 机器学习采用计划与业务结果一致。

  3. 准备人员、流程和环境以进行更改。

请与云解决方案架构师合作来定义策略。

如需获取计划资源(包括计划文档模板),请参阅 Azure 机器学习采用框架

步骤 3:重新生成第一个模型

定义策略后,请迁移第一个模型。

  1. 将数据集迁移到 Azure 机器学习

  2. 使用 Azure 机器学习设计器来重新生成试验

  3. 使用 Azure 机器学习设计器来重新部署 Web 服务

    注意

    本指南是基于 Azure 机器学习 v1 的概念和功能。 Azure 机器学习具有 CLI v2 和 Python SDK v2。 建议使用 v2(而不是 v1)来重新生成工作室(经典版)模型。 请从 Azure 机器学习 v2 开始入手。

步骤 4:集成客户端应用

修改调用工作室(经典)Web 服务的客户端应用程序,以使用新的 Azure 机器学习终结点

步骤 5:清理工作室(经典)资产

为了避免产生额外费用,请清理工作室(经典版)资产。 在验证 Azure 机器学习工作负载之前,你可能需要保留资产以进行回退。

步骤 6:查看并扩展方案

  1. 查看模型迁移的最佳做法并验证工作负载。

  2. 扩展方案并将其他工作负载迁移到 Azure 机器学习。

工作室(经典)和设计器组件映射

请参阅下表,了解在 Azure 机器学习设计器中重新生成工作室(经典版)试验时要使用的模块。

重要

设计器通过开源 Python 包而不是工作室(经典)等 C# 包实现模块。 由于存在这种差异,设计器组件的输出可能会略微不同于其工作室(经典版)对应项。

类别 工作室(经典)模块 替换设计器组件
数据输入和输出 - 手动输入数据
- 导出数据
- 导入数据
- 加载已训练的模型
- 解压缩已压缩的数据集
- 手动输入数据
- 导出数据
- 导入数据
数据格式转换 - 转换为 CSV
- 转换为数据集
- 转换为 ARFF
- 转换为 SVMLight
- 转换为 TSV
- 转换为 CSV
- 转换为数据集
数据转换 - 操作 - 添加列
- 添加行
- 应用 SQL 转换
- 清理缺失的数据
- 转换为指示器值
- 编辑元数据
- 联接数据
- 删除重复的行
- 选择数据集中的列
- 选择列转换
- SMOTE
- 组分类值
- 添加列
- 添加行
- 应用 SQL 转换
- 清理缺失的数据
- 转换为指示器值
- 编辑元数据
- 联接数据
- 删除重复的行
- 选择数据集中的列
- 选择列转换
- SMOTE
数据转换 – 缩放和减少 - 剪切值
- 将数据分组到箱中
- 使数据标准化
- 主体组件分析
- 剪切值
- 将数据分组到箱中
- 使数据标准化
数据转换 – 采样和拆分 - 分区和采样
- 拆分数据
- 分区和采样
- 拆分数据
数据转换 – 筛选 - 应用筛选器
- FIR 筛选器
- IIR 筛选器
- 中间值筛选器
- 移动平均筛选器
- 阈值筛选器
- 用户定义的筛选器
数据转换 – 通过计数进行学习 - 生成计数转换
- 导出计数表
- 导入计数表
- 合并计数转换
- 修改计数表参数
功能选择 - 基于筛选器的特征选择
- 费舍尔线性判别分析
- 排列特征重要性
- 基于筛选器的特征选择
- 排列特征重要性
模型 - 分类 - 多类决策林
- 多类决策森林
- 多类逻辑回归
- 多类神经网络
-“一对多”多类
- 双类平均感知器
- 双类贝叶斯点机
- 双类提升决策树
- 双类决策林
- 双类决策森林
- 双类局部深层 SVM
- 双类逻辑回归
- 双类神经网络
- 双类支持向量机
- 多类决策林
- 多类提升决策树
- 多类逻辑回归
- 多类神经网络
-“一对多”多类
- 双类平均感知器
- 双类提升决策树
- 双类决策林
- 双类逻辑回归
- 双类神经网络
- 双类支持向量机
模型 - 聚类分析 - K-Means 群集 - K-Means 群集
模型 - 回归 - 贝叶斯线性回归
- 提升决策树回归
- 决策林回归
- 快速林分位数回归
- 线性回归
- 神经网络回归
- 顺序回归
- 泊松回归
- 提升决策树回归
- 决策林回归
- 快速林分位数回归
- 线性回归
- 神经网络回归
- 泊松回归
模型 – 异常情况检测 - 单类 SVM
- 基于 PCA 的异常情况检测
- 基于 PCA 的异常情况检测
机器学习 - 评估 - 交叉验证模型
- 评估模型
- 评估推荐器
- 交叉验证模型
- 评估模型
- 评估推荐器
机器学习 - 训练 - 扫描聚类分析
- 训练异常情况检测模型
- 训练聚类分析模型
- 训练 matchbox 推荐器 -
定型模型
- 优化模型超参数
- 训练异常情况检测模型
- 训练聚类分析模型
- 训练模型
- 训练 PyTorch 模型
- 训练 SVD 推荐器
- 训练 Wide and Deep 推荐器
- 优化模型超参数
机器学习 - 评分 - 应用转换
- 将数据分配到聚类
- 为 matchbox 推荐器评分
- 为模型评分
- 应用转换
- 将数据分配到聚类
- 为图像模型评分
- 为模型评分
- 为 SVD 推荐器评分
- 为 Wide and Deep 推荐器评分
OpenCV 库模块 - 导入图像
- 预先训练的级联图像分类
Python 语言模块 - 执行 Python 脚本 - 执行 Python 脚本
- 创建 Python 模型
R 语言模块 - 执行 R 脚本
- 创建 R 模型
- 执行 R 脚本
统计函数 - 应用数学运算
- 计算基础统计信息
- 计算线性相关性
- 评估概率函数
- 替换离散值
- 汇总数据
- 使用 t 测试来测试假设
- 应用数学运算
- 汇总数据
\文本分析 - 检测语言
- 从文本中提取关键短语
- 从文本中提取 N 元语法特征
- 特征哈希
- 隐含狄利克雷分布
- 命名实体识别
- 预处理文本
- 为 vVowpal Wabbit 版本 7-10 模型评分
- 为 Vowpal Wabbit 版本 8 模型评分
- 训练 Vowpal Wabbit 版本 7-10 模型
- 训练 Vowpal Wabbit 版本 8 模型
- 将单词转换为向量
- 从文本中提取 N 元语法特征
- 特征哈希
- 隐含狄利克雷分布
- 预处理文本
- 为 Vowpal Wabbit 模型评分
- 训练 Vowpal Wabbit 模型
Time series (时序) - 时序异常情况检测
Web 服务 - 输入
- Output(输出)
- 输入
- Output(输出)
计算机视觉 - 应用图像转换
- 转换为图像目录
- 初始化图像转换
- 拆分图像目录
- DenseNet 图像分类
- ResNet 图像分类

若要详细了解如何使用各个设计器组件,请参阅算法和组件参考

如果缺少设计器组件,该怎么办?

Azure 机器学习设计器包含工作室(经典)最热门的模块。 它还包括可利用最新机器学习技术的新模块。

如果由于设计器中缺少模块而阻止了迁移,请通过创建支持票证联系我们。

迁移示例

以下迁移示例重点介绍了工作室(经典版)和 Azure 机器学习之间的一些区别。

数据集

在工作室(经典)中,数据集保存在你的工作区中,仅供工作室(经典)使用。

Studio(经典版)中汽车价格数据集的屏幕截图。

在 Azure 机器学习中,数据集注册在工作区中,并且可以在所有 Azure 机器学习中使用。 有关 Azure 机器学习数据集的优势的详细信息,请参阅 Azure 机器学习中的数据

管道

在工作室(经典)中,试验包含工作的处理逻辑。 你已使用拖放模块创建了试验。

Studio(经典版)中汽车价格试验的屏幕截图。

在 Azure 机器学习中,管道包含工作的处理逻辑。 可以使用拖放模块或通过编写代码来创建管道。

经典版中汽车价格拖放管道的屏幕截图。

Web 服务终结点

工作室(经典)使用 REQUEST/RESPOND API 进行实时预测,使用 BATCH EXECUTION API 进行批量预测或重新训练 。

经典版中终结点 API 的屏幕截图。

Azure 机器学习使用实时终结点(托管终结点)进行实时预测,使用管道终结点进行批量预测或重新训练。

实时终结点和管道终结点的屏幕截图。

本文介绍了迁移到 Azure 机器学习的高级要求。 有关详细步骤,请参阅机器学习工作室(经典版)迁移系列中的其他文章:

有关更多迁移资源,请参阅 Azure 机器学习采用框架