什麼是 Azure Machine Learning 設計工具 (v1)?
Azure Machine Learning 設計工具是一種拖放介面,用來在 Azure Machine Learning 中定型和部署模型。 本文描述您可以在設計工具中執行的工作。
注意
設計工具支援兩種類型的元件:傳統預先建置的元件 (v1) 和自訂元件 (v2)。 這兩種類型的元件互不相容。
傳統預先建置元件主要提供用於資料處理和傳統機器學習工作 (例如迴歸和分類) 的預先建置元件。 此類型的元件會繼續受到支援,但將不會新增任何新元件。
自訂元件可讓您包裝自己的程式碼作為元件。 它支援跨工作區共用元件,及跨 Studio、CLI v2 和 SDK v2 介面的無縫製作。
對於新專案,我們強烈建議您使用與 AzureML V2 相容的自訂元件,並且會持續接收新的更新。
本文適用於傳統預先建置元件,且與 CLI v2 和 SDK v2 不相容。
- 如要開始使用設計工具,請參閱教學課程:定型無程式碼迴歸模型。
- 如要瞭解設計工具中可用的元件,請參閱演算法和元件參考。
設計工具會使用您的 Azure Machine Learning 工作區來組織共用的資源,例如:
模型訓練和部署
使用視覺化畫布來建置端對端機器學習工作流程。 在設計工具中定型、測試及部署模型:
- 將資料資產和元件拖放至畫布上。
- 連接所有元件,以建立管線草稿。
- 使用 Azure Machine Learning 工作區中的計算資源,提交管線執行。
- 將您的訓練管線轉換為推斷管線。
- 將管線發佈至 REST 管線端點,提交以不同參數和資料資產執行的新管線。
- 發佈定型管線,以在變更參數和資料資產時重複使用單一管線來將多個模型定型。
- 發佈批次推斷管線,以使用先前訓練的模型對新資料進行預測。
- 將即時推斷管線部署到線上端點,以針對新資料進行即時預測。
管線
管線是由您連接的資料資產和分析元件所組成。 管線有許多用途:您可以建立用來訓練單一模型的管線,或是用來訓練多個模型的管線。 您可以建立可即時或以批次方式進行預測的管線,或建立只清除資料的管線。 管線可讓您重複使用工作及組織您的專案。
管線草稿
當您在設計工具中編輯管線時,您的進度會儲存為管線草稿。 您可以在任何時間點編輯管線草稿,例如新增或移除元件、設定計算目標、建立參數等等。
有效的管線具有下列特性:
- 資料資產只能連接至元件。
- 元件只能連接至資料資產或其他元件。
- 元件的所有輸入連接埠皆必須具有資料流程的某些連線。
- 必須設定每個元件的所有必要參數。
當您準備好要執行管線草稿時,即可提交管線作業。
管線作業
每次執行管線時,管線的設定和其結果都會以管線作業的形式儲存在工作區中。 您可以回到任何管線作業,檢查其是否需要進行疑難排解或稽核。 複製管線作業,以建立新的管線草稿來進行編輯。
管線作業會分組到各個實驗,以組織作業記錄。 您可以設定每個管線作業的實驗。
資料
機器學習資料資產可讓您輕鬆地存取和使用您的資料。 設計工具中包括數個範例資料資產,可供您在實驗時使用。 您可以視需要來註冊更多資料資產。
元件
元件是指您在資料上可執行的演算法。 設計工具有許多元件,從資料輸入函式到定型、評分和驗證流程都有。
元件可能具有一組參數,可用來設定元件的內部演算法。 當您在畫布上選取元件時,元件的參數會顯示在畫布右邊的 [屬性] 窗格中。 您可以在此窗格中修改參數來調整模型。 您可在設計工具中設定個別元件的計算資源。
如需瀏覽可用機器學習服務演算法程式庫的一些說明,請參閱演算法元件參考概觀。 如需演算法選擇的說明,請參閱 Azure Machine Learning 演算法速查表。
計算資源
使用您工作區中的計算資源來執行管線,並將部署的模型裝載為線上端點或管線端點 (適用於批次推斷)。 支援的計算目標包括:
計算目標 | 訓練 | 部署 |
---|---|---|
Azure Machine Learning Compute | ✓ | |
Azure Kubernetes Service | ✓ |
計算目標會附加至您的 Azure Machine Learning 工作區。 您可以在 Azure Machine Learning Studio 的工作區中管理計算目標。
部署
若要執行即時推斷,您必須將管線部署為線上端點。 線上端點會在外部應用程式和您的評分模型之間建立介面。 呼叫線上端點會即時將預測結果傳回到應用程式。 若要對線上端點進行呼叫,請傳遞部署端點時所建立的 API 金鑰。 端點會以 REST 為基礎,這是一種常見的 Web 程式設計專案架構。
線上端點必須部署到 Azure Kubernetes Service 叢集。
若要瞭解如何部署模型,請參閱教學課程:使用設計工具部署機器學習模型。
發佈
您也可以將管線發佈到管線端點。 與線上端點類似,管線端點可讓您使用 REST 呼叫從外部應用程式提交新的管線作業。 不過,您無法使用管線端點即時傳送或接收資料。
已發佈的管線具有彈性,可用於訓練或重新訓練模型、執行批次推斷、處理新資料等等。 您可以將多個管線發佈至單一管線端點,並指定要執行哪個管線版本。
已發佈的管線會在每個元件管線草稿中所定義的計算資源上執行。
設計工具會建立與 SDK 相同的 PublishedPipeline 物件。
下一步
- 透過以下教學課程,了解預測性分析和機器學習的基礎概念:教學課程:使用設計工具預測汽車價格
- 了解如何修改現有的設計工具範例,以符合您的需求。