你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
从工作室(经典版)迁移到 Azure 机器学习
重要
对机器学习工作室(经典版)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
2021 年 12 月之后,无法再创建新的工作室(经典版)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的工作室(经典版)资源。
工作室(经典版)文档即将停用,未来可能不再更新。
了解如何从机器学习工作室(经典版)迁移到 Azure 机器学习。 Azure 机器学习提供了一个现代化的数据科学平台,该平台将无代码和代码优先方法相结合。
本指南将介绍基本的直接迁移过程。 若要优化现有的机器学习工作流或实现机器学习平台的现代化,请参阅 Azure 机器学习采用框架以获得更多资源,包括数字调查工具、工作表和计划模板。
请与云解决方案架构师合作进行迁移。
推荐的方法
若要迁移到 Azure 机器学习,我们建议采用以下方法:
- 步骤 1:评估 Azure 机器学习
- 步骤 2:定义策略和计划
- 步骤 3:重新生成试验和 Web 服务
- 步骤 4:集成客户端应用
- 步骤 5:清理工作室(经典)资产
- 步骤 6:查看并扩展方案
步骤 1:评估 Azure 机器学习
了解 Azure 机器学习及其优势、成本和体系结构。
将 Azure 机器学习和工作室(经典)的功能进行比较。
下表总结主要区别。
功能 工作室(经典版) Azure 机器学习 拖放界面 经典体验 更新的体验:Azure 机器学习设计器 代码 SDK 不支持 与 Azure 机器学习 Python 和 R SDK 完全集成 试验 可缩放(10 GB 训练数据限制) 使用计算目标进行缩放 训练计算目标 专用计算目标,仅限 CPU 支持 各种可自定义的训练计算目标;包括 GPU 和 CPU 支持 部署计算目标 专用 Web 服务格式,不可自定义 各种可自定义的部署计算目标;包括 GPU 和 CPU 支持 机器学习管道 不支持 生成灵活的模块化管道,用于自动完成工作流 MLOps 基本模型管理和部署;仅限 CPU 的部署 实体版本控制(模型、数据、工作流)、工作流自动化、与 CICD 工具集成、CPU 和 GPU 部署,等等 模型格式 专用格式,仅限工作室(经典) 多个受支持的格式,具体取决于训练作业类型 自动化模型训练和超参数优化 不支持 支持
代码优先和无代码选项数据偏移检测 不支持 支持 数据标签项目 不支持 支持 基于角色的访问控制 (RBAC) 仅“参与者”和“所有者”角色 灵活的角色定义和 RBAC 控制 AI 库 支持 不支持
通过示例 Python SDK 笔记本进行了解注意
Azure 机器学习中的设计器功能提供与工作室(经典版)类似的拖放体验。 但是,Azure 机器学习还提供了可靠的代码优先工作流作为替代方法。 此迁移系列重点介绍了设计器,因为它与工作室(经典)体验最为相似。
验证你的关键工作室(经典)模块在 Azure 机器学习设计器中是否受支持。 有关详细信息,请参阅工作室(经典)和设计器组件映射表。
创建 Azure 机器学习工作区。
步骤 2:定义策略和计划
定义业务理由和预期的成果。
让可操作的 Azure 机器学习采用计划与业务结果一致。
准备人员、流程和环境以进行更改。
请与云解决方案架构师合作来定义策略。
如需获取计划资源(包括计划文档模板),请参阅 Azure 机器学习采用框架。
步骤 3:重新生成第一个模型
定义策略后,请迁移第一个模型。
使用 Azure 机器学习设计器来重新生成试验。
使用 Azure 机器学习设计器来重新部署 Web 服务。
注意
本指南是基于 Azure 机器学习 v1 的概念和功能。 Azure 机器学习具有 CLI v2 和 Python SDK v2。 建议使用 v2(而不是 v1)来重新生成工作室(经典版)模型。 请从 Azure 机器学习 v2 开始入手。
步骤 4:集成客户端应用
修改调用工作室(经典)Web 服务的客户端应用程序,以使用新的 Azure 机器学习终结点。
步骤 5:清理工作室(经典)资产
为了避免产生额外费用,请清理工作室(经典版)资产。 在验证 Azure 机器学习工作负载之前,你可能需要保留资产以进行回退。
步骤 6:查看并扩展方案
查看模型迁移的最佳做法并验证工作负载。
扩展方案并将其他工作负载迁移到 Azure 机器学习。
工作室(经典)和设计器组件映射
请参阅下表,了解在 Azure 机器学习设计器中重新生成工作室(经典版)试验时要使用的模块。
重要
设计器通过开源 Python 包而不是工作室(经典)等 C# 包实现模块。 由于存在这种差异,设计器组件的输出可能会略微不同于其工作室(经典版)对应项。
类别 | 工作室(经典)模块 | 替换设计器组件 |
---|---|---|
数据输入和输出 | - 手动输入数据 - 导出数据 - 导入数据 - 加载已训练的模型 - 解压缩已压缩的数据集 |
- 手动输入数据 - 导出数据 - 导入数据 |
数据格式转换 | - 转换为 CSV - 转换为数据集 - 转换为 ARFF - 转换为 SVMLight - 转换为 TSV |
- 转换为 CSV - 转换为数据集 |
数据转换 - 操作 | - 添加列 - 添加行 - 应用 SQL 转换 - 清理缺失的数据 - 转换为指示器值 - 编辑元数据 - 联接数据 - 删除重复的行 - 选择数据集中的列 - 选择列转换 - SMOTE - 组分类值 |
- 添加列 - 添加行 - 应用 SQL 转换 - 清理缺失的数据 - 转换为指示器值 - 编辑元数据 - 联接数据 - 删除重复的行 - 选择数据集中的列 - 选择列转换 - SMOTE |
数据转换 – 缩放和减少 | - 剪切值 - 将数据分组到箱中 - 使数据标准化 - 主体组件分析 |
- 剪切值 - 将数据分组到箱中 - 使数据标准化 |
数据转换 – 采样和拆分 | - 分区和采样 - 拆分数据 |
- 分区和采样 - 拆分数据 |
数据转换 – 筛选 | - 应用筛选器 - FIR 筛选器 - IIR 筛选器 - 中间值筛选器 - 移动平均筛选器 - 阈值筛选器 - 用户定义的筛选器 |
|
数据转换 – 通过计数进行学习 | - 生成计数转换 - 导出计数表 - 导入计数表 - 合并计数转换 - 修改计数表参数 |
|
功能选择 | - 基于筛选器的特征选择 - 费舍尔线性判别分析 - 排列特征重要性 |
- 基于筛选器的特征选择 - 排列特征重要性 |
模型 - 分类 | - 多类决策林 - 多类决策森林 - 多类逻辑回归 - 多类神经网络 -“一对多”多类 - 双类平均感知器 - 双类贝叶斯点机 - 双类提升决策树 - 双类决策林 - 双类决策森林 - 双类局部深层 SVM - 双类逻辑回归 - 双类神经网络 - 双类支持向量机 |
- 多类决策林 - 多类提升决策树 - 多类逻辑回归 - 多类神经网络 -“一对多”多类 - 双类平均感知器 - 双类提升决策树 - 双类决策林 - 双类逻辑回归 - 双类神经网络 - 双类支持向量机 |
模型 - 聚类分析 | - K-Means 群集 | - K-Means 群集 |
模型 - 回归 | - 贝叶斯线性回归 - 提升决策树回归 - 决策林回归 - 快速林分位数回归 - 线性回归 - 神经网络回归 - 顺序回归 - 泊松回归 |
- 提升决策树回归 - 决策林回归 - 快速林分位数回归 - 线性回归 - 神经网络回归 - 泊松回归 |
模型 – 异常情况检测 | - 单类 SVM - 基于 PCA 的异常情况检测 |
- 基于 PCA 的异常情况检测 |
机器学习 - 评估 | - 交叉验证模型 - 评估模型 - 评估推荐器 |
- 交叉验证模型 - 评估模型 - 评估推荐器 |
机器学习 - 训练 | - 扫描聚类分析 - 训练异常情况检测模型 - 训练聚类分析模型 - 训练 matchbox 推荐器 - 定型模型 - 优化模型超参数 |
- 训练异常情况检测模型 - 训练聚类分析模型 - 训练模型 - 训练 PyTorch 模型 - 训练 SVD 推荐器 - 训练 Wide and Deep 推荐器 - 优化模型超参数 |
机器学习 - 评分 | - 应用转换 - 将数据分配到聚类 - 为 matchbox 推荐器评分 - 为模型评分 |
- 应用转换 - 将数据分配到聚类 - 为图像模型评分 - 为模型评分 - 为 SVD 推荐器评分 - 为 Wide and Deep 推荐器评分 |
OpenCV 库模块 | - 导入图像 - 预先训练的级联图像分类 |
|
Python 语言模块 | - 执行 Python 脚本 | - 执行 Python 脚本 - 创建 Python 模型 |
R 语言模块 | - 执行 R 脚本 - 创建 R 模型 |
- 执行 R 脚本 |
统计函数 | - 应用数学运算 - 计算基础统计信息 - 计算线性相关性 - 评估概率函数 - 替换离散值 - 汇总数据 - 使用 t 测试来测试假设 |
- 应用数学运算 - 汇总数据 |
\文本分析 | - 检测语言 - 从文本中提取关键短语 - 从文本中提取 N 元语法特征 - 特征哈希 - 隐含狄利克雷分布 - 命名实体识别 - 预处理文本 - 为 vVowpal Wabbit 版本 7-10 模型评分 - 为 Vowpal Wabbit 版本 8 模型评分 - 训练 Vowpal Wabbit 版本 7-10 模型 - 训练 Vowpal Wabbit 版本 8 模型 |
- 将单词转换为向量 - 从文本中提取 N 元语法特征 - 特征哈希 - 隐含狄利克雷分布 - 预处理文本 - 为 Vowpal Wabbit 模型评分 - 训练 Vowpal Wabbit 模型 |
Time series (时序) | - 时序异常情况检测 | |
Web 服务 | - 输入 - Output(输出) |
- 输入 - Output(输出) |
计算机视觉 | - 应用图像转换 - 转换为图像目录 - 初始化图像转换 - 拆分图像目录 - DenseNet 图像分类 - ResNet 图像分类 |
若要详细了解如何使用各个设计器组件,请参阅算法和组件参考。
如果缺少设计器组件,该怎么办?
Azure 机器学习设计器包含工作室(经典)最热门的模块。 它还包括可利用最新机器学习技术的新模块。
如果由于设计器中缺少模块而阻止了迁移,请通过创建支持票证联系我们。
迁移示例
以下迁移示例重点介绍了工作室(经典版)和 Azure 机器学习之间的一些区别。
数据集
在工作室(经典)中,数据集保存在你的工作区中,仅供工作室(经典)使用。
在 Azure 机器学习中,数据集注册在工作区中,并且可以在所有 Azure 机器学习中使用。 有关 Azure 机器学习数据集的优势的详细信息,请参阅 Azure 机器学习中的数据。
管道
在工作室(经典)中,试验包含工作的处理逻辑。 你已使用拖放模块创建了试验。
在 Azure 机器学习中,管道包含工作的处理逻辑。 可以使用拖放模块或通过编写代码来创建管道。
Web 服务终结点
工作室(经典)使用 REQUEST/RESPOND API 进行实时预测,使用 BATCH EXECUTION API 进行批量预测或重新训练 。
Azure 机器学习使用实时终结点(托管终结点)进行实时预测,使用管道终结点进行批量预测或重新训练。
相关内容
本文介绍了迁移到 Azure 机器学习的高级要求。 有关详细步骤,请参阅机器学习工作室(经典版)迁移系列中的其他文章:
有关更多迁移资源,请参阅 Azure 机器学习采用框架。
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈