AutoML 分類

發行項
07/31/2023

本文描述 Azure Machine Learning 設計工具中的一個元件。

使用此元件來建立以 AutoML 分類為基礎的機器學習模型。

如何設定

此元件會在表格式資料上建立分類模型。

此模型需要訓練資料集。驗證和測試資料集是選擇性的。

AutoML 會平行建立一些管線，以嘗試模型的不同演算法和參數。服務會逐一查看與特徵選取項目配對的 ML 演算法，其中每個反覆項目都會產生具有定型分數的模型。您可以選擇要讓模型優化的計量。所選計量的分數越好，模型就會被視為「符合」您的資料。您可以定義實驗的結束準則。結束準則將會是模型，其中包含您想要 AutoML 尋找的特定定型分數。一旦達到定義的結束準則，它就會停止。此元件接著會輸出在資料集執行結束時產生的最佳模型。

將 AutoML 分類 元件新增至管線。
指定您想要模型輸出的目標資料行
針對 [分類]，您也可以啟用深度學習。

如果啟用了深度學習，則驗證會限制為 train_validation 分割。

(選擇性) 檢視其他組態設定：可用來更進一步控制訓練作業的其他設定。否則會根據實驗選取範圍和資料來套用預設值。

其他組態	描述
主要計量	用來評分模型的主要計量。深入了解模型計量。
透過負責任 AI 儀表板偵錯模型	產生負責任 AI 儀表板，以針對建議的最佳模型進行整體評定和偵錯。這包括模型說明、公平性和效能總管、資料總管和模型錯誤分析等深入解析。深入瞭解如何產生負責任 AI 儀表板。
封鎖的演算法	選取要從訓練作業中排除的演算法。允許演算法僅用於 SDK 實驗。請參閱每個工作類型支援的模型。
結束準則	當符合其中任何一項準則時，訓練作業即會停止。訓練作業時間 (小時)：允許訓練作業執行的時間長度。計量分數閾值：所有管線的最低計量分數。這可確保若擁有想要達到的已定義目標計量，則不會在訓練作業上花費超過必要程度的時間。
並行	並行反覆項目上限：要在訓練作業中測試的管線 (反覆項目) 數量上限。作業不會執行超過指定數量的反覆項目。深入瞭解自動化 ML 如何執行叢集上的多個子作業。

[選擇性] 驗證和測試表單可讓您執行下列作業。
1. 指定要用於訓練作業的驗證類型。
2. 提供測試資料集 (預覽) 來評估自動化 ML 在實驗結束時為您產生的建議模型。您提供測試資料時，測試作業會在實驗結束時進行自動觸發。此測試作業只會在自動化 ML 所建議的最佳模型上作業。
  
  重要
  
  提供測試資料集來評估產生的模型是預覽功能。此功能是實驗性預覽功能，而且可能隨時變更。
  - 測試資料會被視為與訓練和驗證不同，因此不會使得建議模型的測試作業結果產生偏差。深入了解模型驗證期間的偏差。
  - 您可以提供自己的測試資料集，或選擇使用訓練資料集的百分比。測試資料的格式必須是 Azure Machine Learning TabularDataset。
  - 測試資料集的結構描述應該符合訓練資料集。目標資料行是選擇性的，但如果沒有指定目標資料行，則不會計算任何測試單位。
  - 測試資料集不應與訓練資料集或驗證資料集相同。

後續步驟

請參閱 Azure Machine Learning 可用的元件集。

AutoML 分類

如何設定

後續步驟

其他資源