迁移到无服务器实时推理

重要

  • 本文档已过时,将来可能不会更新。 本内容中提及的产品、服务或技术不再受支持。
  • 本文中的指南适用于模型服务功能(以前称为无服务器实时推理)的预览版本。 Databricks 建议将模型服务工作流迁移到正式版功能。 请参阅 Azure Databricks 中的模型服务

重要

此功能目前以公共预览版提供。

本文演示如何在工作区上启用无服务器实时推理,并将模型从使用旧版 MLflow 模型服务切换到使用无服务器实时推理进行模型服务。

有关无服务器实时推理的一般信息,请参阅使用无服务器实时推理进行模型服务

要求

  • MLflow 模型注册表中已注册的模型。
  • 工作区中的“群集创建”权限。 请参阅配置群集创建权利
  • 已注册模型中的“可以管理生产版本”权限。 请参阅共享 MLflow 模型

重大更改

  • 在无服务器实时推理中,对终结点的请求和来自终结点的响应的格式与旧版 MLflow 模型服务略有不同。 有关新格式协议的详细信息,请参阅为模型终结点评分
  • 在无服务器实时推理中,终结点 URL 包括 model-endpoint 而不是 model
  • 无服务器实时推理包括对使用 API 工作流管理资源的完全支持,并且已准备好生产。

用于工作区的启用无服务器实时推理

重要

必须为工作区启用无服务器实时推理。 首次为工作区启用无服务器实时推理时,工作区管理员必须阅读并接受条款和条件。

为工作区启用无服务器实时推理:

  1. 注册预览版。
    1. 请联系你的 Azure Databricks 帐户团队,请求加入无服务器实时推理公共预览版
    2. Databricks 会向你发送 Google 表单。
    3. 填写表单并将其提交给 Databricks。 表单包含有关要注册的工作区的信息。
    4. 等待 Databricks 通知你工作区已在预览版中注册。
  2. 以工作区管理员身份访问管理员设置页
  3. 选择“工作区设置”。
  4. 选择“MLflow 无服务器实时推理启用”。

禁用模型上的旧版 MLflow 模型服务

需要在当前服务模型上禁用旧版 MLflow 模型服务,然后才能为模型启用无服务器实时推理。

以下步骤演示如何使用 UI 完成此操作。

  1. 导航到机器学习工作区边栏上的“模型”。
  2. 选择要为其禁用旧版 MLflow 模型服务的模型。
  3. 在“服务”选项卡上,选择“停止”。
  4. 一条消息随即显示,用于进行确认。 选择“停止服务”。

在模型上启用无服务器实时推理

在工作区上启用无服务器实时推理后,你将在已注册模型的“服务”选项卡上看到以下屏幕。 若要为该模型启用无服务器实时推理,请单击“启用无服务器实时推理”按钮。

Serving pane

重要

如果未看到该按钮,而是看到“启用服务”按钮,则表示使用的是旧版 MLflow 模型的终结点,而不是无服务器模型终结点。 请与工作区管理员联系以在此工作区上启用该功能

其他资源