Azure Machine Learning 字彙

Azure Machine Learning 詞彙是 Machine Learning 平台術語的簡編字典。 如需一般 Azure 術語,請另行參閱:

元件

Machine Learning 元件是獨立式程式碼片段,可在機器學習管線中執行一個步驟。 元件是進階機器學習管線的建置區塊。 元件可以執行資料處理、模型定型和模型評分等工作。 元件類似於函式。 其具有名稱和參數、預期輸入,並會傳回輸出。

計算

計算是您可以用來執行工作或是裝載端點的指定計算資源。 Machine Learning 支援下列計算類型:

  • 計算叢集:受控計算基礎結構,可讓您用來輕鬆地在雲端中建立 CPU 或 GPU 計算節點的叢集。

    注意

    請勿建立計算叢集,而是使用無伺服器計算將計算生命週期管理卸載至 Azure Machine Learning。

  • 計算執行個體:已完整設定和完全受控的雲端開發環境。 您可以使用執行個體作為開發和測試的定型或推斷計算。 其類似於雲端的虛擬機器。

  • Kubernetes 叢集:可用於將定型的機器學習模型部署到 Azure Kubernetes Service (AKS)。 您可以從 Machine Learning 工作區建立 AKS 叢集,或附加現有的 AKS 叢集。

  • 附加的計算:您可以將自己的計算資源附加至工作區,並將其用於定型和推斷。

資料

Machine Learning 可讓您使用不同類型的資料:

  • URI (本機或雲端儲存體中的位置):
    • uri_folder
    • uri_file
  • 資料表 (表格式資料抽象概念):
    • mltable
  • 基本型別:
    • string
    • boolean
    • number

在大部分情況下,您將使用 URI (uri_folderuri_file) 來識別儲存體中的位置,其可藉由將儲存體裝載或下載至節點,輕鬆地對應至作業中計算節點的檔案系統。

mltable 參數是表格式資料的抽象概念,用於自動化機器學習 (AutoML) 作業、平行作業和一些進階案例。 如果您剛開始使用 Machine Learning 且未使用 AutoML,強烈建議您開始使用 URI。

Datastore

Machine Learning 資料存放區安全保留 Azure 資料儲存體的連線資訊,因此您不需要寫在指令碼中。 您可以註冊及建立資料存放區,輕鬆連線至儲存體帳戶,並存取基礎儲存體服務中的資料。 Azure Machine Learning CLI v2 和 SDK v2 支援下列類型的雲端式儲存體服務:

  • Azure Blob 儲存體容器
  • Azure 檔案共用
  • Azure Data Lake 儲存體
  • Azure Data Lake Storage Gen2

Environment

Machine Learning 環境是您機器學習工作執行環境的封裝。 這些環境會針對您的定型和評分指令碼指定軟體套件、環境變數和軟體設定。 這些環境是您的機器學習工作區中受控且已建立版本的實體。 環境支援在各種計算的可重現性、可稽核和可攜式機器學習工作流程。

環境類型

Machine Learning 支援兩種類型的環境:策展和自訂。

策展環境由 Machine Learning 提供,依預設在工作區中可用。 其主要是依原樣使用。 其含有 Python 封裝和設定的集合,協助您開始使用各種機器學習架構。 這些預先建立的環境也能加快部署時間。 若要擷取可用環境的完整清單,請參閱使用 CLI 和 SDK 的 Azure 機器學習 環境(v2)。

在自訂環境中,須由您負責設定環境。 請務必在計算上安裝定型或評分指令碼所需的封裝和其他相依性。 Machine Learning 可讓您使用以下方式建立自己的環境:

  • Docker 映像。
  • 具有 conda YAML 基礎的 Docker 映像,以進一步自訂。
  • Docker 建置內容。

模型

機器學習模型包含二進位檔案,這些檔案代表機器學習模型和任何對應的中繼資料。 您可以從本機或遠端的檔案或目錄建立模型。 針對遠端位置 https,支援 wasbsazureml 位置。 所建立的模型會在工作區中以指定的名稱和版本受到追蹤。 機器學習 支援三種類型的模型儲存格式:

  • custom_model
  • mlflow_model
  • triton_model

工作區

工作區是 Machine Learning 的最上層資源。 其可以在您使用 Machine Learning 時,提供集中式位置以處理您建立的所有成品。 工作區保留所有工作的歷程記錄,包括記錄、計量、輸出,以及指令碼的快照集。 工作區會儲存資料存放區與計算等資源的參考。 其也會保存所有資產,例如模型、環境、元件和資料資產。

下一步

什麼是 Azure Machine Learning 服務?