AutoML 預測

本文描述 Azure Machine Learning 設計工具中的一個元件。

使用此元件建立以 AutoML 預測為基礎的機器學習模型。

如何設定

此元件會建立預測模型。 因為預測是受監督的學習方法,所以您需要包含標籤資料行的卷 標資料集 ,其中包含所有資料列的值。 請遵循此連結以取得 如何準備資料集的詳細資訊。 資料集需要已 加上標籤的資料集 ,其中包含具有所有資料列值的標籤資料行。

此模型需要訓練資料集。 驗證和測試資料集是選擇性的。

AutoML 會平行建立數個管線,以嘗試模型的不同演算法和參數。 服務會逐一查看與特徵選取項目配對的 ML 演算法,其中每個反覆項目都會產生具有定型分數的模型。 您可以選擇您想要讓模型優化的計量。 所選計量的分數越好,模型就會被視為「符合」您的資料。 您可以定義實驗的結束準則。 結束準則將會是具有您想要 AutoML 尋找之特定定型分數的模型。 一旦達到定義的結束準則,它就會停止。 此元件接著會輸出在資料集執行結束時產生的最佳模型。

  1. AutoML 預測 元件新增至管線。

  2. 指定您想要讓模型使用的 training_data

  3. 指定您想要讓 AutoML 用來測量模型成功 的主要計量

  4. 指定您想要模型輸出的目標資料行

  5. 在 [ 工作類型和設定 ] 表單上,選取工作類型:預測。 如需詳細資訊,請參閱支援的工作類型

    1. 針對 [預測],您可以:

      1. 啟用深度學習。

      2. 選取時間資料行:這個資料行包含要使用的時間資料。

      3. 選取預測範圍:指出模型能夠預測未來多少時間單位 (分鐘/小時/天/週/月/年)。 模型需要針對未來預測的時間越長,其正確性越低。 深入了解預測及預測範圍

  6. (選擇性) 檢視其他組態設定:可用來更進一步控制訓練作業的其他設定。 否則會根據實驗選取範圍和資料來套用預設值。

    其他組態 描述
    主要計量 用來評分模型的主要計量。 深入了解模型計量
    解釋最佳模型 選取啟用或停用,以顯示建議的最佳模型說明。
    這項功能目前不適用於特定的預測演算法
    封鎖的演算法 選取要從訓練作業中排除的演算法。

    允許演算法僅用於 SDK 實驗
    請參閱每個工作類型支援的模型
    結束準則 當符合其中任何一項準則時,訓練作業即會停止。
    訓練作業時間 (小時):允許訓練作業執行的時間長度。
    計量分數閾值:所有管線的最低計量分數。 這可確保若擁有想要達到的已定義目標計量,則不會在訓練作業上花費超過必要程度的時間。
    並行 並行反覆項目上限:要在訓練作業中測試的管線 (反覆項目) 數量上限。 作業不會執行超過指定數量的反覆項目。 深入瞭解自動化 ML 如何執行叢集上的多個子作業

後續步驟

請參閱 Azure Machine Learning 可用的元件集