遷移至無伺服器即時推斷
重要
- 此檔已淘汰,且可能未更新。 不再支援此內容中所提及的產品、服務或技術。
- 本文中的指引適用於模型服務預覽版本,先前稱為無伺服器即時推斷功能。 Databricks 建議您將服務工作流程的模型移轉至正式運作的功能。 請參閱 使用 Azure Databricks 提供服務的模型。
重要
這項功能處於公開預覽狀態。
本文示範如何在工作區上啟用無伺服器即時推斷,並將模型從使用 舊版 MLflow 模型服務 切換至使用無伺服器即時推斷服務的模型。
如需無伺服器即時推斷的一般資訊,請參閱 使用無伺服器即時推斷的模型服務。
需求
- MLflow 模型登錄中的已註冊模型。
- 叢集在工作區中建立許可權。 請參閱 管理權利。
- 可以管理已註冊模型的生產版本許可權。 請參閱 MLFlow 模型 ACL。
重大變更
- 在無伺服器即時推斷中,對端點的要求格式和端點的回應與舊版 MLflow 模型服務稍有不同。 如需新格式通訊協議的詳細資訊,請參閱 為模型端點 評分。
- 在無伺服器即時推斷中,端點 URL 包含
model-endpoint
而不是model
- 無伺服器即時推斷包含使用 API 工作流程 管理資源的完整支援,且已準備好生產環境。
為您的工作區啟用無伺服器即時推斷
重要
您必須為工作區啟用無伺服器即時推斷。 工作區管理員第一次啟用工作區時,必須讀取並接受條款和條件。
若要為您的工作區啟用無伺服器即時推斷:
- 在預覽版中註冊。
- 請連絡您的 Azure Databricks 帳戶小組,要求加入無伺服器即時推斷 公開預覽。
- Databricks 會傳送 Google 表單。
- 填寫窗體,並將其提交至 Databricks。 表單包含要註冊之工作區的相關信息。
- 等到 Databricks 通知您工作區已在預覽版中註冊。
- 身為工作區系統管理員,存取系統管理員 設定頁面。
- 選取[工作區設定]。
- 選取 [MLflow 無伺服器即時推斷啟用]。
停用模型上的舊版 MLflow 模型服務
您必須先停用目前服務模型的舊版 MLflow 模型服務,才能為您的模型啟用無伺服器即時推斷。
下列步驟示範如何使用UI來完成此作業。
- 流覽至 機器學習 工作區提要字段上的 [模型]。
- 選取您要停用舊版 MLflow 模型服務的模型。
- 在 [ 服務] 索引標籤上,選取 [ 停止]。
- 此時會出現一則訊息以確認。 選取 [ 停止服務]。
在您的模型上啟用無伺服器即時推斷
在工作區上啟用無伺服器即時推斷之後,您會在已註冊模型的 [服務] 索引標籤上看到下列畫面。 若要啟用該模型的無伺服器即時推斷,請按兩下 [ 啟用無伺服器即時推斷 ] 按鈕。
重要
如果您沒有看到該按鈕,但改為看到 [ 啟用服務 ] 按鈕,則會使用舊版 MLflow 模型服務而非無伺服器模型端點的端點。 請連絡工作區管理員以 啟用此工作區上的功能。
其他資源
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應