AutoML 回歸

本文描述 Azure Machine Learning 設計工具中的一個元件。

使用此元件建立以 AutoML 回歸為基礎的機器學習模型。

如何設定

此模型需要訓練資料集。 驗證和測試資料集是選擇性的。

AutoML 會平行建立數個管線,以嘗試模型的不同演算法和參數。 服務會逐一查看與特徵選取項目配對的 ML 演算法,其中每個反覆項目都會產生具有定型分數的模型。 您可以選擇您想要讓模型優化的計量。 所選計量的分數越好,模型就會被視為「符合」您的資料。 您可以定義實驗的結束準則。 結束準則將會是具有您想要 AutoML 尋找之特定定型分數的模型。 一旦達到定義的結束準則,它就會停止。 此元件接著會輸出在資料集執行結束時產生的最佳模型。 如需 結束準則 (終止原則的詳細資訊, 請流覽此連結) 。

  1. AutoML 回歸 元件新增至管線。

  2. 指定您想要模型輸出的目標資料行

  3. (選擇性) 檢視其他組態設定:可用來更進一步控制訓練作業的其他設定。 否則會根據實驗選取範圍和資料來套用預設值。

    其他組態 描述
    主要計量 用來評分模型的主要計量。 深入了解模型計量
    透過負責任 AI 儀表板對模型進行偵錯 產生負責任 AI 儀表板,以針對建議的最佳模型進行整體評定和偵錯。 這包括模型說明、公平性和效能總管、資料總管和模型錯誤分析等見解。 深入瞭解如何產生負責任 AI 儀表板。
    封鎖的演算法 選取要從訓練作業中排除的演算法。

    允許演算法僅用於 SDK 實驗
    請參閱每個工作類型支援的模型
    結束準則 當符合其中任何一項準則時,訓練作業即會停止。
    訓練作業時間 (小時):允許訓練作業執行的時間長度。
    計量分數閾值:所有管線的最低計量分數。 這可確保若擁有想要達到的已定義目標計量,則不會在訓練作業上花費超過必要程度的時間。
    並行 並行反覆項目上限:要在訓練作業中測試的管線 (反覆項目) 數量上限。 作業不會執行超過指定數量的反覆項目。 深入瞭解自動化 ML 如何執行叢集上的多個子作業
  4. [選擇性] 驗證和測試表單可讓您執行下列作業。

    1. 指定要用於訓練作業的驗證類型。

    2. 提供測試資料集 (預覽) 來評估自動化 ML 在實驗結束時為您產生的建議模型。 您提供測試資料時,測試作業會在實驗結束時進行自動觸發。 此測試作業只會在自動化 ML 所建議的最佳模型上作業。

      重要

      提供測試資料集來評估產生的模型是預覽功能。 此功能是實驗性預覽功能,而且可能隨時變更。

      • 測試資料會被視為與訓練和驗證不同,因此不會使得建議模型的測試作業結果產生偏差。 深入了解模型驗證期間的偏差
      • 您可以提供自己的測試資料集,或選擇使用訓練資料集的百分比。 測試資料的格式必須是 Azure Machine Learning TabularDataset
      • 測試資料集的結構描述應該符合訓練資料集。 目標資料行是選擇性的,但如果沒有指定目標資料行,則不會計算任何測試單位。
      • 測試資料集不應與訓練資料集或驗證資料集相同。
      • 預測作業不支援訓練/測試分割。

後續步驟

請參閱 Azure Machine Learning 可用的元件集