通过 Azure 机器学习将深度学习工作负载部署到生产环境

高级
数据科学家
Azure 机器学习

由于模型大小的原因,部署用于实时推理的大规模模型非常困难。 了解在模型评分过程中,你可以执行的操作以及可用于优化模型性能的框架。

学习目标

本模块介绍了以下内容:

  • 选择适当的推理策略
  • 用 ONNX 优化模型评分
  • 将 Triton 部署为托管联机终结点

先决条件

在开始本模块之前,你应该熟悉 Azure 机器学习服务以及训练机器学习模型和深度学习模型。