你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

计划管理 Azure 机器学习的成本

本文介绍如何计划和管理 Azure 机器学习成本。 首先,请在添加任何资源以前,使用 Azure 定价计算器来帮助规划成本。 接下来,在添加 Azure 资源时,查看预估成本。

开始使用 Azure 机器学习资源后,使用成本管理功能来设置预算和监视成本。 另外,还应查看预测的成本并识别支出趋势,以确定可能需要实施措施的领域。

请知晓,Azure 机器学习的成本只是 Azure 账单中每月成本的一部分。 如果使用其他 Azure 服务,则需要为 Azure 订阅中使用的所有 Azure 服务和资源(包括第三方服务)付费。 本文介绍如何为 Azure 机器学习计划和管理成本。 在熟悉了如何管理 Azure 机器学习成本之后,应用类似的方法来管理订阅中使用的所有 Azure 服务的成本。

有关优化成本的详细信息,请参阅管理和优化 Azure 机器学习成本

先决条件

Microsoft 成本管理中的成本分析支持大多数 Azure 帐户类型,但并非支持所有帐户类型。 若要查看支持的帐户类型的完整列表,请参阅了解成本管理数据

若要查看成本数据,至少需要对 Azure 帐户具有读取访问权限。 若要了解如何分配对成本管理数据的访问权限,请参阅分配对数据的访问权限

使用 Azure 机器学习之前估计成本

在 Azure 机器学习工作区创建资源之前,请使用 Azure 定价计算器估算成本。 在定价计算器左侧,选择“AI + 机器学习”,然后选择“Azure 机器学习”,开始操作

以下屏幕截图显示了定价计算器中的一个示例成本估算:

屏幕截图显示了 Azure 定价计算器中的预估成本的示例。

向工作区添加资源时,请返回到此计算器,并在此处添加相同资源来更新成本估算。

有关详细信息,请参阅 Azure 机器学习定价

了解 Azure 机器学习的完整计费模式

Azure 机器学习在 Azure 基础结构上运行,部署新资源时,Azure 基础结构会随 Azure 机器学习的使用产生成本。 需要了解的是,增加基础结构可能会产生成本。 对已部署的资源进行更改时需要管理该成本。

会随 Azure 机器学习的使用而产生的成本

为 Azure 机器学习工作区创建资源时,会同时创建其他 Azure 服务的资源。 它们是:

当你创建计算实例时,虚拟机 (VM) 保持打开状态,以供你使用。

  • 启用空闲关闭,以便在 VM 空闲时长达到指定值时节省成本。
  • 或者设置一个计划来自动启动和停止计算实例,以便在未计划使用计算实例时降低成本。

删除资源后可能会产生成本

在 Azure 门户中或使用 Azure CLI 删除 Azure 机器学习工作区之前,以下子资源均是累计的常见成本,即使你在工作区中未处于活动状态亦会如此。 如果你计划稍后返回 Azure 机器学习工作区,这些资源可能会持续产生成本。

  • VM
  • 负载均衡器
  • Azure 虚拟网络
  • 带宽

将按每个 VM 的运行时数计费。 成本取决于 VM 规范。 在运行但不主动处理数据集的 VM 仍通过负载均衡器进行计费。 对于每个计算实例,每天会对一个负载均衡器计费。 计算群集的每 50 节点将有一个计费的标准负载均衡器。 每个负载均衡器每天计费约 0.33 美元。 若要避免计算已停止计算实例和计算群集上的负载均衡器成本,请删除计算资源。

计算实例也会产生 P10 磁盘成本,即使处于停止状态也是如此,因为保存在那里的任何用户内容都会以停止状态持续存在,类似于 Azure VM。 我们正在努力使 OS 磁盘大小/类型可配置,以更好地控制成本。 对于 Azure 虚拟网络,将按订阅和区域对一个虚拟网络计费。 虚拟网络不能跨区域或订阅。 在虚拟网络中设置专用终结点也可能产生费用。 如果虚拟网络使用 Azure 防火墙,也可能会产生费用。 带宽费用反映的是使用量;传输的数据越多,费用就越高。

提示

  • Azure 机器学习托管虚拟网络可以免费使用。 但是,托管网络的某些功能依赖于 Azure 专用链接(适用于专用终结点)和 Azure 防火墙(适用于 FQDN 规则),这会产生费用。 有关详细信息,请参阅托管虚拟网络隔离
  • 托管联机终结点使用 VM 进行部署。 如果已提交创建联机部署的请求,而该请求失败,则可能已经过了创建计算的阶段。 在这种情况下,失败的部署会产生费用。 如果已完成对失败的调试或调查,可以删除失败的部署来节省成本。

删除资源后可能会产生成本

在 Azure 门户中或使用 Azure CLI 删除某个 Azure 机器学习工作区后,以下资源会继续存在。 它们会持续产生成本,直到将其删除。

  • Azure 容器注册表
  • Azure Blob 存储
  • 密钥保管库
  • Application Insights

要同时删除工作区和这些从属资源,请使用 SDK:

适用于:Python SDK azure-ai-ml v2(当前版本)

from azure.ai.ml.entities import Workspace
ml_client.workspaces.begin_delete(name=ws.name, delete_dependent_resources=True)

如果在工作区中创建 Azure Kubernetes 服务 (AKS),或将任何计算资源附加到工作区,需要在 Azure 门户中单独删除这些资源。

将 Azure 预付款信用额度与 Azure 机器学习结合使用

可以使用 Azure 预付额度支付 Azure 机器学习费用。 但是,不能使用 Azure 预付款额度来为第三方产品和服务(包括 Azure 市场中的第三方产品和服务)付费。

在 Azure 门户中查看估计成本

为 Azure 机器学习创建计算资源时,可以看到估计成本。

若要创建计算实例并查看估计价格,请执行以下操作:

  1. 登录到 Azure 机器学习工作室
  2. 在左侧选择“计算”。
  3. 在顶部工具栏中,选择“+ 新建”。
  4. 查看为每个可用虚拟机大小显示的估计价格。
  5. 完成资源创建过程。

屏幕截图显示了创建计算实例的估计成本。

如果你的 Azure 订阅有支出限制,Azure 将阻止超过额度金额的支出。 创建和使用 Azure 资源时,将使用额度。 达到额度限制时,将在该计费周期的剩余时间内禁用部署的资源。 你无法更改额度限制,但可以删除该限制。 有关支出限制的详细信息,请参阅 Azure 支出限制

监视成本

将 Azure 资源与 Azure 机器学习一起使用时,会产生成本。 Azure 资源使用情况的单位成本因时间间隔(秒、分钟、小时和天)或单位使用情况(字节、MB 等)而异。一旦开始使用 Azure 机器学习,就会产生费用,你可以在成本分析中看到这些费用。

使用成本分析时,可以在图表中查看不同时间间隔的 Azure 机器学习成本。 有些示例是按天、当前、上个月和年划分的。 还可以对比预算和预测的成本来查看成本。 随着时间的推移切换到较长的视图,可帮助你确定支出趋势。 你会看到可能出现超支的地方。 如果已创建预算,还可以轻松查看超支的地方。

若要在成本分析中查看 Azure 机器学习,请执行以下操作:

  1. 登录到 Azure 门户。
  2. 在 Azure 门户中打开范围,并在菜单中选择“成本分析”。 例如,转到“订阅”,从列表中选择订阅,然后在菜单中选择“成本分析” 。 选择“范围”,在成本分析中切换到不同的范围。
  3. 默认情况下,服务的成本显示在第一个圆环图中。 选择图表中标记为“Azure 机器学习”的区域。

最初打开成本分析时,会显示实际的每月成本。 下面是一个显示了所有每月使用成本的示例。

屏幕截图显示了订阅的累计成本。

若要缩小单个服务(如 Azure 机器学习)的成本,请选择“添加筛选器”,然后选择“服务名称” 。 然后选择“虚拟机”。

下面的示例只显示了 Azure 机器学习的成本。

屏幕截图显示了 ServiceName 的累计成本。

在前面的示例中,可查看服务的当前成本。 还显示了 Azure 区域(位置)的成本和资源组的 Azure 机器学习成本。 从这里,你可以自行探索成本。

创建预算

可以创建预算来管理成本,并创建警报以自动通知利益干系人支出异常和超支风险。 警报基于与预算和成本阈值相比的支出。 预算和警报是针对 Azure 订阅和资源组创建的,作为总体成本监视策略的一部分,它们非常有用。

如果希望增加监视中的精度,可以在 Azure 中使用筛选器为特定资源或服务创建预算。 筛选器可帮助确保不会意外创建会产生额外成本的新资源。 有关创建预算时筛选器选项的详细信息,请参阅对选项进行分组和筛选

导出成本数据

还可以将成本数据导出到存储帐户。 当你或其他人需要进行有关成本的更多数据分析时,这非常有用。 例如,财务团队可以使用 Excel 或 Power BI 来分析数据。 可以按每天、每周或每月计划导出成本,并设置自定义的日期范围。 建议导出成本数据来检索成本数据集。

管理和降低 Azure 机器学习成本的其他方式

使用以下技巧来帮助管理和优化计算资源成本。

  • 配置训练群集以实现自动缩放。
  • 为托管联机终结点配置自动缩放。
  • 在订阅和工作区上设置配额。
  • 针对训练作业设置终止策略。
  • 使用低优先级虚拟机。
  • 将计算实例计划为自动关闭并启动。
  • 使用 Azure 虚拟机预留实例。
  • 在本地训练。
  • 并行化训练。
  • 设置数据保留和删除策略。
  • 将资源部署到同一区域。
  • 如果你不打算很快使用实例、群集和/或联机部署,请将它们删除。
  • 如果为其创建了计算,则删除失败的部署。

有关详细信息,请参阅管理和优化 Azure 机器学习成本

后续步骤