共用方式為


什麼是自動化機器學習 (AutoML)?

自動化的機器學習 (AutoML) 會自動化將機器學習套用至資料的程序。 指定資料集,您可以執行 AutoML 來逐一查看不同的資料轉換、機器學習演算法和超參數,以選取最佳的模型。

注意

本文參考的是目前處於預覽狀態的 ML.NET AutoML API。 資料可能會有變更。

AutoML 的運作方式為何?

一般而言,將機器學習模型定型的工作流程如下:

  • 定義問題
  • 收集資料
  • 預先處理資料
  • 將模型定型
  • 評估模型

傳統 ML 和 AutoML 定型工作流程

前置處理、定型和評估是一種實驗性和反覆程序,需要多次試驗,直到您達到滿意的結果為止。 由於這些工作通常會重複,AutoML 可協助自動化這些步驟。 除了自動化之外,在定型及評估程序期間會使用最佳化技術來尋找及選取演算法和超參數。

何時應使用 AutoML?

不論您剛開始使用機器學習或您是有經驗的使用者,AutoML 都能提供自動化模型開發程序的解決方案。

  • 初學者 - 如果您不熟悉機器學習,AutoML 會提供一組預設值來簡化模型開發程序,以減少定型模型時必須做出的決策次數。 如此一來,您就可以專注於您的資料,以及您嘗試解決的問題,並讓 AutoML 執行其餘工作。
  • 有經驗的使用者 - 如果您有機器學習的經驗,則可根據需求自訂、設定及擴充 AutoML 所提供的預設值,同時仍利用其自動化功能。

ML.NET 中的 AutoML

  • Featurizer - 便利的 API,可將資料前置處理自動化。
  • 試用版 - 執行單一超參數最佳化。
  • 實驗 - AutoML 試用版的集合。 ML.NET 提供用於建立實驗的高階 API,可設定個別可掃掠管線、搜尋空間和微調器元件的預設值。
  • 搜尋空間 - 可從中選擇超參數的可用選項範圍。
  • 微調器 - 用來最佳化超參數的演算法。 ML.NET 支援下列微調器:
    • 成本訓練微調器 - 成本相關超參數的訓練最佳化實作,其會將定型成本納入考慮
    • Eci 成本訓練微調器 - 針對階層式搜尋空間實作成本訓練微調器。 AutoML 使用的預設微調器。
    • SMAC - 使用隨機樹系來套用貝氏最佳化的微調程式。
    • 格線搜尋 - 最適合小型搜尋空間的微調器。
    • 隨機搜尋
  • 可掃掠估算器 - 包含搜尋空間的 ML.NET 估算器。
  • 可掃掠管線 - 包含一或多個可掃掠估算器的 ML.NET 管線。
  • 試用執行器 - 使用可掃掠管線和試用設定的 AutoML 元件,可從模型定型和評估產生試用結果。

建議初學者從高階實驗 API 所提供的預設值開始進行。 如需更有經驗的使用者尋找自訂選項,請使用可掃掠估算器、可掃掠管線、搜尋空間、試用執行器和微調器元件。

如需開始使用 AutoML API 的詳細資訊,請參閱如何使用 ML.NET 自動化機器學習 (AutoML) API 指南。

支援的工作

AutoML 提供下列工作的預先設定預設值:

  • 二元分類
  • 多類別分類
  • 迴歸

針對其他工作,您可以建置自己的試用執行器來啟用這些案例。 如需詳細資訊,請參閱如何使用 ML.NET 自動化機器學習 (AutoML) API 指南。

下一步