AutoML 分類

本文描述 Azure Machine Learning 設計工具中的一個元件。

使用此元件來建立以 AutoML 分類為基礎的機器學習模型。

如何設定

此元件會在表格式資料上建立分類模型。

此模型需要訓練資料集。 驗證和測試資料集是選擇性的。

AutoML 會平行建立一些管線,以嘗試模型的不同演算法和參數。 服務會逐一查看與特徵選取項目配對的 ML 演算法,其中每個反覆項目都會產生具有定型分數的模型。 您可以選擇要讓模型優化的計量。 所選計量的分數越好,模型就會被視為「符合」您的資料。 您可以定義實驗的結束準則。 結束準則將會是模型,其中包含您想要 AutoML 尋找的特定定型分數。 一旦達到定義的結束準則,它就會停止。 此元件接著會輸出在資料集執行結束時產生的最佳模型。

  1. AutoML 分類 元件新增至管線。

  2. 指定您想要模型輸出的目標資料行

  3. 針對 [分類],您也可以啟用深度學習。

如果啟用了深度學習,則驗證會限制為 train_validation 分割

  1. (選擇性) 檢視其他組態設定:可用來更進一步控制訓練作業的其他設定。 否則會根據實驗選取範圍和資料來套用預設值。

    其他組態 描述
    主要計量 用來評分模型的主要計量。 深入了解模型計量
    透過負責任 AI 儀表板偵錯模型 產生負責任 AI 儀表板,以針對建議的最佳模型進行整體評定和偵錯。 這包括模型說明、公平性和效能總管、資料總管和模型錯誤分析等深入解析。 深入瞭解如何產生負責任 AI 儀表板。
    封鎖的演算法 選取要從訓練作業中排除的演算法。

    允許演算法僅用於 SDK 實驗
    請參閱每個工作類型支援的模型
    結束準則 當符合其中任何一項準則時,訓練作業即會停止。
    訓練作業時間 (小時):允許訓練作業執行的時間長度。
    計量分數閾值:所有管線的最低計量分數。 這可確保若擁有想要達到的已定義目標計量,則不會在訓練作業上花費超過必要程度的時間。
    並行 並行反覆項目上限:要在訓練作業中測試的管線 (反覆項目) 數量上限。 作業不會執行超過指定數量的反覆項目。 深入瞭解自動化 ML 如何執行叢集上的多個子作業
  2. [選擇性] 驗證和測試表單可讓您執行下列作業。

    1. 指定要用於訓練作業的驗證類型。

    2. 提供測試資料集 (預覽) 來評估自動化 ML 在實驗結束時為您產生的建議模型。 您提供測試資料時,測試作業會在實驗結束時進行自動觸發。 此測試作業只會在自動化 ML 所建議的最佳模型上作業。

      重要

      提供測試資料集來評估產生的模型是預覽功能。 此功能是實驗性預覽功能,而且可能隨時變更。

      • 測試資料會被視為與訓練和驗證不同,因此不會使得建議模型的測試作業結果產生偏差。 深入了解模型驗證期間的偏差
      • 您可以提供自己的測試資料集,或選擇使用訓練資料集的百分比。 測試資料的格式必須是 Azure Machine Learning TabularDataset
      • 測試資料集的結構描述應該符合訓練資料集。 目標資料行是選擇性的,但如果沒有指定目標資料行,則不會計算任何測試單位。
      • 測試資料集不應與訓練資料集或驗證資料集相同。

後續步驟

請參閱 Azure Machine Learning 可用的元件集