什麼是 Azure Machine Learning 設計工具 (v2)?

Azure Machine Learning 設計工具是拖放功能 UI 介面,可用於 Azure Machine Learning 工作區中組建機器學習管線。

如下方 GIF 所示,透過拖放建置組塊並加以連接,即可以視覺化方式組建管線。

GIF of a building a pipeline in the designer.

注意

設計工具支援兩種類型的元件:傳統預先建置的元件 (v1) 和自訂元件 (v2)。 這兩種類型的元件互不相容。

傳統預先建置的元件支援一般資料處理和機器學習工作,包括迴歸和分類。 儘管會繼續支援傳統預先建置的元件,但不會新增任何新元件。

自訂元件可讓您將自己的程式碼包裝為元件,從而實現跨工作區共用,以及跨 Azure Machine Learning Studio、CLI v2 和 SDK v2 介面的順暢撰寫。

針對新專案,強烈建議您使用自訂元件,因其與 AzureML V2 相容,且能繼續接收新的更新。

本文適用於自訂元件。

資產

管線的建置組塊在 Azure Machine Learning 中稱為資產,其中包括:

設計工具在左側有資產庫,您可以在其中存取建立管線所需的所有資產。 其中會顯示您在工作區中建立的資產,以及您有權存取的登錄中共用資產。

Screenshot of the asset library.

若要查看特定登錄中的資產,請選取資產庫上方的 [登錄名稱] 篩選條件。 您在目前工作區中建立的資產位於登錄 = 工作區中。 Azure Machine Learning 所提供的資產位於登錄 = azureml 中。

設計工具僅顯示您在工作區中建立和命名的資產。 您不會在資產庫中看到任何未命名的資產。 若要了解如何建立資料和元件資產,請閱讀下列文章:

管線

設計工具是一種工具,可讓您以視覺化方式使用資產建立管線。 當您使用設計工具時,會遇到兩個與管線相關的概念:管線草稿和管線作業。

Screenshot of pipeline draft and pipeline job list.

管線草稿

當您在設計工具中編輯管線時,您的進度會儲存為管線草稿。 您可以在任何時間點編輯管線草稿,例如新增或移除元件、設定計算目標、建立參數等等。

有效的管線草稿具有下列特性:

  • 資料資產只能連接至元件。
  • 元件只能連接至資料資產或其他元件。
  • 元件的所有必要輸入連接埠皆必須具有資料流程的某些連線。
  • 必須設定每個元件的所有必要參數。

當您準備好要執行管線草稿時,即可提交管線作業。

管線作業

每次執行管線時,管線的設定和其結果都會以管線作業的形式儲存在工作區中。 您可以回到任何管線作業,檢查其是否需要進行疑難排解或稽核。 複製管線作業,建立新的管線草稿以繼續編輯。

在設計工具中組建管線的方法

從頭開始建立新管線

您可以建立新管線,並從頭開始組建。 在設計工具中建立管線時,請記得選取 [自訂元件] 選項。

Screenshot showing to select custom component.

複製現有的管線作業

如果您想要根據工作區中的現有管線作業來工作,您可以輕鬆地將其複製到新的管線草稿,以繼續編輯。

Screenshot of a pipeline job in the workspace with the clone button highlighted.

複製之後,您也可以選取 [顯示譜系] 來得知從中複製的管線作業。

Screenshot showing the draft lineage after selecting show lineage button.

您可以編輯管線,然後再提交一次。 提交之後,您可以在 [作業詳細資料] 頁面中選取 [顯示譜系],以查看您提交作業與原始作業之間的譜系。

後續步驟