什麼是 Azure Machine Learning 設計工具 (v1)?

Azure Machine Learning 設計工具是一種拖放介面,用來在 Azure Machine Learning 中定型和部署模型。 本文描述您可以在設計工具中執行的工作。

注意

設計工具支援兩種類型的元件:傳統預先建置的元件 (v1) 和自訂元件 (v2)。 這兩種類型的元件互不相容。

傳統預先建置元件主要提供用於資料處理和傳統機器學習工作 (例如迴歸和分類) 的預先建置元件。 此類型的元件會繼續受到支援,但將不會新增任何新元件。

自訂元件可讓您包裝自己的程式碼作為元件。 它支援跨工作區共用元件,及跨 Studio、CLI v2 和 SDK v2 介面的無縫製作。

對於新專案,我們強烈建議您使用與 AzureML V2 相容的自訂元件,並且會持續接收新的更新。

本文適用於傳統預先建置元件,且與 CLI v2 和 SDK v2 不相容。

GIF of a building a pipeline in the designer.

設計工具會使用您的 Azure Machine Learning 工作區來組織共用的資源,例如:

模型訓練和部署

使用視覺化畫布來建置端對端機器學習工作流程。 在設計工具中定型、測試及部署模型:

  • 資料資產元件拖放至畫布上。
  • 連接所有元件,以建立管線草稿
  • 使用 Azure Machine Learning 工作區中的計算資源,提交管線執行
  • 將您的訓練管線轉換為推斷管線
  • 將管線發佈至 REST 管線端點,提交以不同參數和資料資產執行的新管線。
    • 發佈定型管線,以在變更參數和資料資產時重複使用單一管線來將多個模型定型。
    • 發佈批次推斷管線,以使用先前訓練的模型對新資料進行預測。
  • 即時推斷管線部署到線上端點,以針對新資料進行即時預測。

Workflow diagram for training, batch inference, and real-time inference in the designer.

管線

管線是由您連接的資料資產和分析元件所組成。 管線有許多用途:您可以建立用來訓練單一模型的管線,或是用來訓練多個模型的管線。 您可以建立可即時或以批次方式進行預測的管線,或建立只清除資料的管線。 管線可讓您重複使用工作及組織您的專案。

管線草稿

當您在設計工具中編輯管線時,您的進度會儲存為管線草稿。 您可以在任何時間點編輯管線草稿,例如新增或移除元件、設定計算目標、建立參數等等。

有效的管線具有下列特性:

  • 資料資產只能連接至元件。
  • 元件只能連接至資料資產或其他元件。
  • 元件的所有輸入連接埠皆必須具有資料流程的某些連線。
  • 必須設定每個元件的所有必要參數。

當您準備好要執行管線草稿時,即可提交管線作業。

管線作業

每次執行管線時,管線的設定和其結果都會以管線作業的形式儲存在工作區中。 您可以回到任何管線作業,檢查其是否需要進行疑難排解或稽核。 複製管線作業,以建立新的管線草稿來進行編輯。

管線作業會分組到各個實驗,以組織作業記錄。 您可以設定每個管線作業的實驗。

資料

機器學習資料資產可讓您輕鬆地存取和使用您的資料。 設計工具中包括數個範例資料資產,可供您在實驗時使用。 您可以視需要來註冊更多資料資產。

元件

元件是指您在資料上可執行的演算法。 設計工具有許多元件,從資料輸入函式到定型、評分和驗證流程都有。

元件可能具有一組參數,可用來設定元件的內部演算法。 當您在畫布上選取元件時,元件的參數會顯示在畫布右邊的 [屬性] 窗格中。 您可以在此窗格中修改參數來調整模型。 您可在設計工具中設定個別元件的計算資源。

Screenshot showing the component properties.

如需瀏覽可用機器學習服務演算法程式庫的一些說明,請參閱演算法元件參考概觀。 如需演算法選擇的說明,請參閱 Azure Machine Learning 演算法速查表

計算資源

使用您工作區中的計算資源來執行管線,並將部署的模型裝載為線上端點或管線端點 (適用於批次推斷)。 支援的計算目標包括:

計算目標 訓練 部署
Azure Machine Learning Compute
Azure Kubernetes Service

計算目標會附加至您的 Azure Machine Learning 工作區。 您可以在 Azure Machine Learning Studio 的工作區中管理計算目標。

部署

若要執行即時推斷,您必須將管線部署為線上端點。 線上端點會在外部應用程式和您的評分模型之間建立介面。 呼叫線上端點會即時將預測結果傳回到應用程式。 若要對線上端點進行呼叫,請傳遞部署端點時所建立的 API 金鑰。 端點會以 REST 為基礎,這是一種常見的 Web 程式設計專案架構。

線上端點必須部署到 Azure Kubernetes Service 叢集。

若要瞭解如何部署模型,請參閱教學課程:使用設計工具部署機器學習模型

發佈

您也可以將管線發佈到管線端點。 與線上端點類似,管線端點可讓您使用 REST 呼叫從外部應用程式提交新的管線作業。 不過,您無法使用管線端點即時傳送或接收資料。

已發佈的管線具有彈性,可用於訓練或重新訓練模型、執行批次推斷、處理新資料等等。 您可以將多個管線發佈至單一管線端點,並指定要執行哪個管線版本。

已發佈的管線會在每個元件管線草稿中所定義的計算資源上執行。

設計工具會建立與 SDK 相同的 PublishedPipeline 物件。

下一步