什麼是 Azure Machine Learning 中的設計工具 (v1)?
Azure Machine Learning 設計工具是一種拖放功能介面,用來在 Azure Machine Learning 工作室中定型和部署模型。 本文描述您可以在設計工具中執行的工作。
重要
Azure Machine Learning 中的設計工具支援兩種類型的管線,一種使用傳統預先建置 (v1),另一種使用自訂 (v2) 元件。 兩種元件類型在管線中不相容,且設計工具 v1 與 CLI v2 和 SDK v2 不相容。 本文適用於使用傳統預先建置 (v1) 元件的管線。
傳統預先建置的元件 (v1) 包含一般資料處理和機器學習工作,例如迴歸和分類。 Azure Machine Learning 會繼續支援現有的傳統預先建置元件,但不會新增預先建置元件。 此外,部署傳統預先建置 (v1) 元件並不支援受控線上端點 (v2)。
自訂元件 (v2) 可讓您將自己的程式碼包裝為元件,從而實現跨工作區共用,以及跨 Azure Machine Learning 工作室、CLI v2 和 SDK v2 介面的順暢製作。 最好在新專案中使用自訂元件,因為與 Azure Machine Learning v2 相容,且可繼續接收新的更新。 如需自訂元件和設計工具 (v2) 的詳細資訊,請參閱 Azure Machine Learning 設計工具 (v2)。
下列動畫 GIF 顯示如何在設計工具中拖放資產並建立連結,以視覺方式建置管線。
如要瞭解設計工具中可用的元件,請參閱演算法和元件參考。 如要開始使用設計工具,請參閱教學課程:定型無程式碼迴歸模型。
模型訓練和部署
設計工具會使用您的 Azure Machine Learning 工作區來組織共用的資源,例如:
下圖說明如何使用設計工具來建置端對端機器學習工作流程。 您可以在設計工具介面中定型、測試及部署模型。
- 將資料資產和元件拖放到設計工具視覺畫布上,然後連接元件以建立管線草稿。
- 提交管線作業,該作業使用 Azure Machine Learning 工作區中的計算資源。
- 將您的訓練管線轉換為推斷管線。
- 將管線發佈至 REST 管線端點,提交使用不同參數和資料資產執行的新管線。
- 發佈定型管線,以在變更參數和資料資產時重複使用單一管線來將多個模型定型。
- 發佈批次推斷管線,以使用先前訓練的模型對新資料進行預測。
- 將即時推斷管線部署到線上端點,以針對新資料進行即時預測。
資料
機器學習資料資產可讓您輕鬆地存取和使用您的資料。 設計工具包含數個範例資料資產,可供您在實驗時使用。 您可以視需要來註冊更多資料資產。
元件
元件是指您可以對資料執行的演算法。 設計工具有許多元件,從資料輸入函式到定型、評分和驗證流程都有。
元件包含參數,您可用來設定元件的內部演算法。 當您在畫布上選取元件時,元件的參數和其他設定會顯示在畫布右側的屬性窗格中。 您可以在該窗格中修改參數,以及設定個別元件的計算資源。
如需進一步了解可用的機器學習演算法程式庫,請參閱演算法和元件參考。 如需演算法選擇的說明,請參閱 Azure Machine Learning 演算法速查表。
管線
管線是由您連接的資料資產和分析元件所組成。 管線可協助您重複使用工作及組織您的專案。
管線有許多用途。 您可以建立管線以執行下列作業:
- 定型單一模型。
- 定型多個模型。
- 建立即時或批次預測。
- 僅清除資料。
管線草稿
當您在設計工具中編輯管線時,您的進度會儲存為管線草稿。 您可以在任何時間點編輯管線草稿,例如新增或移除元件、設定計算目標或設定參數等等。
有效的管線具有下列特性:
- 資料資產只能連接至元件。
- 元件只能連接至資料資產或其他元件。
- 元件的所有輸入連接埠皆必須具有資料流程的某些連線。
- 必須設定每個元件的所有必要參數。
當您準備好要執行管線草稿時,可以儲存管線並提交管線作業。
管線作業
每次執行管線時,管線的設定和其結果都會以管線作業的形式儲存在工作區中。 管線作業會分組到各個實驗,以組織作業記錄。
您可以回到任何管線作業,檢查其是否需要進行疑難排解或稽核。 複製管線作業,以建立新的管線草稿進行編輯。
計算資源
計算目標會附加至 Azure Machine Learning 工作室中的 Azure Machine Learning 工作區。 使用您工作區中的計算資源來執行管線,並將部署的模型裝載為線上端點或管線端點 (適用於批次推斷)。 支援的計算目標如下:
計算目標 | 訓練 | 部署 |
---|---|---|
Azure Machine Learning Compute | ✓ | |
Azure Kubernetes Service (AKS) | ✓ |
部署
若要執行即時推斷,您必須將管線部署為線上端點。 線上端點會在外部應用程式和您的評分模型之間建立介面。 端點會以 REST 為基礎,這是一種常見的 Web 程式設計專案架構。 呼叫線上端點會即時將預測結果傳回到應用程式。
若要對線上端點進行呼叫,請傳遞部署端點時所建立的 API 金鑰。 線上端點必須部署到 AKS 叢集。 若要瞭解如何部署模型,請參閱教學課程:使用設計工具部署機器學習模型。
發佈
您也可以將管線發佈到管線端點。 與線上端點類似,管線端點可讓您使用 REST 呼叫,從外部應用程式提交新的管線作業。 不過,您無法使用管線端點來即時傳送或接收資料。
已發佈的管線端點具有彈性,且可用於定型或重新定型模型、執行批次推斷或處理新資料。 您可以將多個管線發佈至單一管線端點,並指定要執行哪個管線版本。
已發佈的管線會在每個元件管線草稿中所定義的計算資源上執行。 設計工具會建立與 SDK 相同的 PublishedPipeline 物件。
相關內容
- 透過以下教學課程,了解預測性分析和機器學習的基礎概念:教學課程:使用設計工具預測汽車價格。
- 了解如何修改現有的設計工具範例,以符合您的需求。