迁移到无服务器实时推理
重要
- 本文档已过时,将来可能不会更新。 本内容中提及的产品、服务或技术不再受支持。
- 本文中的指南适用于模型服务功能(以前称为无服务器实时推理)的预览版本。 Databricks 建议将模型服务工作流迁移到正式版功能。 请参阅 Azure Databricks 中的模型服务。
重要
此功能目前以公共预览版提供。
本文演示如何在工作区上启用无服务器实时推理,并将模型从使用旧版 MLflow 模型服务切换到使用无服务器实时推理进行模型服务。
有关无服务器实时推理的一般信息,请参阅使用无服务器实时推理进行模型服务。
要求
- MLflow 模型注册表中已注册的模型。
- 工作区中的“群集创建”权限。 请参阅配置群集创建权利。
- 已注册模型中的“可以管理生产版本”权限。 请参阅共享 MLflow 模型。
重大更改
- 在无服务器实时推理中,对终结点的请求和来自终结点的响应的格式与旧版 MLflow 模型服务略有不同。 有关新格式协议的详细信息,请参阅为模型终结点评分。
- 在无服务器实时推理中,终结点 URL 包括
model-endpoint
而不是model
- 无服务器实时推理包括对使用 API 工作流管理资源的完全支持,并且已准备好生产。
用于工作区的启用无服务器实时推理
重要
必须为工作区启用无服务器实时推理。 首次为工作区启用无服务器实时推理时,工作区管理员必须阅读并接受条款和条件。
为工作区启用无服务器实时推理:
- 注册预览版。
- 请联系你的 Azure Databricks 帐户团队,请求加入无服务器实时推理公共预览版。
- Databricks 会向你发送 Google 表单。
- 填写表单并将其提交给 Databricks。 表单包含有关要注册的工作区的信息。
- 等待 Databricks 通知你工作区已在预览版中注册。
- 以工作区管理员身份访问管理员设置页。
- 选择“工作区设置”。
- 选择“MLflow 无服务器实时推理启用”。
禁用模型上的旧版 MLflow 模型服务
需要在当前服务模型上禁用旧版 MLflow 模型服务,然后才能为模型启用无服务器实时推理。
以下步骤演示如何使用 UI 完成此操作。
- 导航到机器学习工作区边栏上的“模型”。
- 选择要为其禁用旧版 MLflow 模型服务的模型。
- 在“服务”选项卡上,选择“停止”。
- 一条消息随即显示,用于进行确认。 选择“停止服务”。
在模型上启用无服务器实时推理
在工作区上启用无服务器实时推理后,你将在已注册模型的“服务”选项卡上看到以下屏幕。 若要为该模型启用无服务器实时推理,请单击“启用无服务器实时推理”按钮。
重要
如果未看到该按钮,而是看到“启用服务”按钮,则表示使用的是旧版 MLflow 模型的终结点,而不是无服务器模型终结点。 请与工作区管理员联系以在此工作区上启用该功能。