分享方式:


什麼是 Azure Machine Learning 中的設計工具 (v1)?

Azure Machine Learning 設計工具是一種拖放功能介面,用來在 Azure Machine Learning 工作室中定型和部署模型。 本文描述您可以在設計工具中執行的工作。

重要

Azure Machine Learning 中的設計工具支援兩種類型的管線,一種使用傳統預先建置 (v1),另一種使用自訂 (v2) 元件。 兩種元件類型在管線中不相容,且設計工具 v1 與 CLI v2 和 SDK v2 不相容。 本文適用於使用傳統預先建置 (v1) 元件的管線。

  • 傳統預先建置的元件 (v1) 包含一般資料處理和機器學習工作,例如迴歸和分類。 Azure Machine Learning 會繼續支援現有的傳統預先建置元件,但不會新增預先建置元件。 此外,部署傳統預先建置 (v1) 元件並不支援受控線上端點 (v2)。

  • 自訂元件 (v2) 可讓您將自己的程式碼包裝為元件,從而實現跨工作區共用,以及跨 Azure Machine Learning 工作室、CLI v2 和 SDK v2 介面的順暢製作。 最好在新專案中使用自訂元件,因為與 Azure Machine Learning v2 相容,且可繼續接收新的更新。 如需自訂元件和設計工具 (v2) 的詳細資訊,請參閱 Azure Machine Learning 設計工具 (v2)

下列動畫 GIF 顯示如何在設計工具中拖放資產並建立連結,以視覺方式建置管線。

設計工具中建置管線的 GIF。

如要瞭解設計工具中可用的元件,請參閱演算法和元件參考。 如要開始使用設計工具,請參閱教學課程:定型無程式碼迴歸模型

模型訓練和部署

設計工具會使用您的 Azure Machine Learning 工作區來組織共用的資源,例如:

下圖說明如何使用設計工具來建置端對端機器學習工作流程。 您可以在設計工具介面中定型、測試及部署模型。

設計工具中訓練、批次推斷和即時推斷的工作流程圖。

  • 資料資產元件拖放到設計工具視覺畫布上,然後連接元件以建立管線草稿
  • 提交管線作業,該作業使用 Azure Machine Learning 工作區中的計算資源。
  • 將您的訓練管線轉換為推斷管線
  • 將管線發佈至 REST 管線端點,提交使用不同參數和資料資產執行的新管線。
    • 發佈定型管線,以在變更參數和資料資產時重複使用單一管線來將多個模型定型。
    • 發佈批次推斷管線,以使用先前訓練的模型對新資料進行預測。
  • 即時推斷管線部署到線上端點,以針對新資料進行即時預測。

資料

機器學習資料資產可讓您輕鬆地存取和使用您的資料。 設計工具包含數個範例資料資產,可供您在實驗時使用。 您可以視需要來註冊更多資料資產。

元件

元件是指您可以對資料執行的演算法。 設計工具有許多元件,從資料輸入函式到定型、評分和驗證流程都有。

元件包含參數,您可用來設定元件的內部演算法。 當您在畫布上選取元件時,元件的參數和其他設定會顯示在畫布右側的屬性窗格中。 您可以在該窗格中修改參數,以及設定個別元件的計算資源。

此螢幕擷取畫面顯示元件屬性。

如需進一步了解可用的機器學習演算法程式庫,請參閱演算法和元件參考。 如需演算法選擇的說明,請參閱 Azure Machine Learning 演算法速查表

管線

管線是由您連接的資料資產和分析元件所組成。 管線可協助您重複使用工作及組織您的專案。

管線有許多用途。 您可以建立管線以執行下列作業:

  • 定型單一模型。
  • 定型多個模型。
  • 建立即時或批次預測。
  • 僅清除資料。

管線草稿

當您在設計工具中編輯管線時,您的進度會儲存為管線草稿。 您可以在任何時間點編輯管線草稿,例如新增或移除元件、設定計算目標或設定參數等等。

有效的管線具有下列特性:

  • 資料資產只能連接至元件。
  • 元件只能連接至資料資產或其他元件。
  • 元件的所有輸入連接埠皆必須具有資料流程的某些連線。
  • 必須設定每個元件的所有必要參數。

當您準備好要執行管線草稿時,可以儲存管線並提交管線作業。

管線作業

每次執行管線時,管線的設定和其結果都會以管線作業的形式儲存在工作區中。 管線作業會分組到各個實驗,以組織作業記錄。

您可以回到任何管線作業,檢查其是否需要進行疑難排解或稽核。 複製管線作業,以建立新的管線草稿進行編輯。

計算資源

計算目標會附加至 Azure Machine Learning 工作室中的 Azure Machine Learning 工作區。 使用您工作區中的計算資源來執行管線,並將部署的模型裝載為線上端點或管線端點 (適用於批次推斷)。 支援的計算目標如下:

計算目標 訓練 部署
Azure Machine Learning Compute
Azure Kubernetes Service (AKS)

部署

若要執行即時推斷,您必須將管線部署為線上端點。 線上端點會在外部應用程式和您的評分模型之間建立介面。 端點會以 REST 為基礎,這是一種常見的 Web 程式設計專案架構。 呼叫線上端點會即時將預測結果傳回到應用程式。

若要對線上端點進行呼叫,請傳遞部署端點時所建立的 API 金鑰。 線上端點必須部署到 AKS 叢集。 若要瞭解如何部署模型,請參閱教學課程:使用設計工具部署機器學習模型

發佈

您也可以將管線發佈到管線端點。 與線上端點類似,管線端點可讓您使用 REST 呼叫,從外部應用程式提交新的管線作業。 不過,您無法使用管線端點來即時傳送或接收資料。

已發佈的管線端點具有彈性,且可用於定型或重新定型模型、執行批次推斷或處理新資料。 您可以將多個管線發佈至單一管線端點,並指定要執行哪個管線版本。

已發佈的管線會在每個元件管線草稿中所定義的計算資源上執行。 設計工具會建立與 SDK 相同的 PublishedPipeline 物件。