遷移至無伺服器即時推斷

重要

  • 此檔已淘汰,且可能未更新。 不再支援此內容中所提及的產品、服務或技術。
  • 本文中的指引適用於模型服務預覽版本,先前稱為無伺服器即時推斷功能。 Databricks 建議您將服務工作流程的模型移轉至正式運作的功能。 請參閱 使用 Azure Databricks 提供服務的模型。

重要

這項功能處於公開預覽狀態

本文示範如何在工作區上啟用無伺服器即時推斷,並將模型從使用 舊版 MLflow 模型服務 切換至使用無伺服器即時推斷服務的模型。

如需無伺服器即時推斷的一般資訊,請參閱 使用無伺服器即時推斷的模型服務。

需求

  • MLflow 模型登錄中的已註冊模型。
  • 叢集在工作區中建立許可權。 請參閱 管理權利
  • 可以管理已註冊模型的生產版本許可權。 請參閱 MLFlow 模型 ACL

重大變更

  • 在無伺服器即時推斷中,對端點的要求格式和端點的回應與舊版 MLflow 模型服務稍有不同。 如需新格式通訊協議的詳細資訊,請參閱 為模型端點 評分。
  • 在無伺服器即時推斷中,端點 URL 包含 model-endpoint 而不是 model
  • 無伺服器即時推斷包含使用 API 工作流程 管理資源的完整支援,且已準備好生產環境。

為您的工作區啟用無伺服器即時推斷

重要

您必須為工作區啟用無伺服器即時推斷。 工作區管理員第一次啟用工作區時,必須讀取並接受條款和條件。

若要為您的工作區啟用無伺服器即時推斷:

  1. 在預覽版中註冊。
    1. 請連絡您的 Azure Databricks 帳戶小組,要求加入無伺服器即時推斷 公開預覽
    2. Databricks 會傳送 Google 表單。
    3. 填寫窗體,並將其提交至 Databricks。 表單包含要註冊之工作區的相關信息。
    4. 等到 Databricks 通知您工作區已在預覽版中註冊。
  2. 身為工作區系統管理員,存取系統管理員 設定頁面
  3. 選取[工作區設定]
  4. 選取 [MLflow 無伺服器即時推斷啟用]。

停用模型上的舊版 MLflow 模型服務

您必須先停用目前服務模型的舊版 MLflow 模型服務,才能為您的模型啟用無伺服器即時推斷。

下列步驟示範如何使用UI來完成此作業。

  1. 流覽至 機器學習 工作區提要字段上的 [模型]。
  2. 選取您要停用舊版 MLflow 模型服務的模型。
  3. 在 [ 服務] 索引標籤上,選取 [ 停止]。
  4. 此時會出現一則訊息以確認。 選取 [ 停止服務]。

在您的模型上啟用無伺服器即時推斷

在工作區上啟用無伺服器即時推斷之後,您會在已註冊模型的 [服務] 索引標籤上看到下列畫面。 若要啟用該模型的無伺服器即時推斷,請按兩下 [ 啟用無伺服器即時推斷 ] 按鈕。

服務窗格

重要

如果您沒有看到該按鈕,但改為看到 [ 啟用服務 ] 按鈕,則會使用舊版 MLflow 模型服務而非無伺服器模型端點的端點。 請連絡工作區管理員以 啟用此工作區上的功能。

其他資源