Fabric 中的低程式碼 AutoML 介面讓你只需指定機器學習任務和幾個基本設定,就能輕鬆開始機器學習。 根據這些選擇,AutoML 介面會根據你的輸入產生預先設定的筆記本。 當你執行筆記本時,它會自動記錄並追蹤現有機器學習實驗和模型項目中的所有模型指標與迭代,提供有組織且有效率的方式來管理和評估模型效能。
重要
這項功能處於預覽狀態。
必要條件
訂閱Microsoft Fabric。 或者,註冊免費的Microsoft Fabric試用。
使用首頁左下角的體驗切換器切換到 Fabric。
此截圖顯示在體驗切換器功能表中選擇「Fabric」的畫面。
設置自動化機器學習試驗
你可以方便地直接從現有的實驗、模型或筆記本項目在 Fabric 中啟動 AutoML 精靈。
實驗專案中 AutoML 進入點的螢幕快照。
選擇資料來源
作為 Fabric 中的 AutoML 使用者,您可以從可用的資料湖屋中選擇,輕鬆存取並分析平台內儲存的資料。 選擇湖屋後,請選擇一個特定的表格或檔案來執行 AutoML 任務。
在 AutoML 中選取 Lakehouse 的螢幕快照。
提示
選擇湖屋時,你可以選擇表格或檔案來搭配 AutoML 使用。 支援的文件類型包括 CSV、XLS、XLSX 和 JSON。
定義 ML 模型用途
在此步驟中,用戶藉由選取 最適合其數據和目標的ML工作 來定義其模型的目的。
在 AutoML 中選取模型工作和模式的螢幕快照。
Fabric 的 AutoML 精靈提供以下機器學習任務:
- 回歸: 用於預測連續數值。
- 二元分類: 將數據分類為兩個類別的其中一個。
- 多類別分類: 將數據分類為多個類別之一。
- 預測: 用於針對時間序列數據進行預測。
選擇好機器學習任務後,你可以選擇 自動機器學習模式。 每個模式都會設定 AutoML 試用版的預設組態,例如要探索的模型,以及配置來尋找最佳模型的時間。 可用的模式如下:
- 快速原型: 提供快速的結果,非常適合用於快速測試和反覆執行。
- 可解譯模式: 執行時間較長,並著重於原本更容易解譯的模型。
- 最佳配適: 使用擴充運行時間進行更全面的搜尋,以尋找最佳的可能模型。
- 自定義: 可讓您在 AutoML 試用版中手動調整某些設定,以取得量身打造的設定。
選取正確的 ML 工作和 AutoML 模式,可確保 AutoML 精靈會根據您的所選設定來符合您的目標、平衡速度、可解譯性和效能。
設定訓練資料
在此步驟中,你會配置 AutoML 用來建立模型的訓練資料。 從選擇預測欄位開始,這是模型將訓練以預測的目標欄位。
設定 AutoML 訓練數據的螢幕快照。
選取預測資料行之後,您可以進一步自訂輸入資料的處理方式:
- 資料類型: 檢視並調整每個輸入欄位的資料類型,以確保相容性並優化模型效能。
- 插補方法:選擇插補方法來處理數據集中的遺漏值,這會根據您的喜好填滿數據中的缺口。
您也可以啟用或停用 自動特徵化 設定。 啟用時,自動特徵化會產生其他功能以進行定型,並可能藉由從您的數據擷取額外的見解來增強模型效能。 定義這些數據設定可協助 AutoML 精靈準確地解譯及處理數據集,以改善試用結果的品質。
AutoML 自動特徵化的螢幕快照。
提供最終詳細數據
接著,你可以決定如何執行 AutoML 試驗,以及實驗和輸出的命名慣例。 您有兩個選項可用來執行 AutoML 試用版:
同時訓練多個模型: 如果你的資料能載入 pandas DataFrame,這樣你就能用 Spark 叢集同時運行多個模型,這個選項就很理想。 此方法會藉由一次定型數個模型來加速試用程式。
使用 Spark 依序訓練模型:此選項適用於較大的數據集,或受益於分布式訓練的數據集。 它會使用Spark和SynapseML來探索分散式模型,並使用Spark提供的延展性一次定型一個模型。
注意
目前, Spark 模式 不支援記錄基於 Spark 的模型的輸入與輸出結構。 此架構是 SynapseML PREDICT 函式的必要欄位。 作為一個變通方法,你可以直接用 MLflow 載入模型,並在筆記本內進行推論,這樣就能跳過預測所需的結構要求。
選取執行模式之後,請指定 Notebook、實驗和模型的名稱,以完成您的設定。 這些命名規則有助於組織 Fabric 中的 AutoML 資產,並方便追蹤和管理試驗。 完成後,會根據你的選擇產生筆記本,隨時可執行與自訂。
檢視和建立筆記本
在最後一步,你有機會檢視所有 AutoML 設定,並預覽與你選擇相符的生成程式碼。 這是您確保所選 ML 工作、模式、資料設定和其他設定符合您目標的機會。
完成 AutoML 詳細數據的螢幕快照。
當你滿意後,就可以完成這個步驟,製作一本包含 AutoML 試驗所有組件的筆記本。 此筆記本可讓您追蹤程式的每個階段,從數據準備到模型評估,並做為工作的完整記錄。 您也可以視需要進一步自定義此筆記本,調整程式代碼和設定來精簡您的 AutoML 試用結果。
追蹤您的 AutoML 執行
一旦你執行筆記本,AutoML 程式碼會利用 MLflow 記錄 ,自動追蹤試驗中每個模型的關鍵指標與參數。 此無縫整合可讓您監視和檢閱 AutoML 執行的每個反覆專案,而不需要額外的設定。
觀看 AutoML 執行機器學習實驗的截圖。
若要探索 AutoML 試用版的結果:
流覽至 ML 實驗專案:在 ML 實驗中,您可以追蹤 AutoML 程式所建立的所有不同執行。 每個執行都會記錄寶貴的詳細數據,例如模型效能計量、參數和組態,讓您輕鬆地分析和比較結果。
檢視 AutoML 配置: 每個 AutoML 試驗中,你都會看到所使用的 AutoML 配置,提供每個模型如何設置以及哪些設定能達到最佳結果的洞見。
找出最佳模型: 開啟 ML 模型 ,以從 AutoML 試用版存取最終表現最佳的模型。
此追蹤工作流程可協助您組織、評估及管理模型,確保您能完整瞭解 AutoML 試用版中測試之每個模型的效能和設定。 從這裡,你可以利用 SynapseML 的 PREDICT 介面 ,或直接從筆記本產生預測。
下一步
- 瞭解 AutoML
- 嘗試使用 AutoML Python API