使用 MLflow 追蹤模型開發
本文包含 Azure Databricks 中追蹤模型開發的範例。 使用 MLflow 自動記錄和追蹤 ML 和深度學習模型,或使用 MLflow API 手動進行。
模型追蹤和 MLflow
模型開發程式是反覆的,當您開發和優化模型時,追蹤您的工作可能會很困難。 在 Azure Databricks 中,您可以使用 MLflow 追蹤 來協助您追蹤模型開發程式,包括您嘗試的參數設定或組合,以及它們如何影響模型的效能。
MLflow 追蹤會使用實驗和執行來記錄和追蹤您的 ML 和深度學習模型開發。 執行是模型程式代碼的單一執行。 在 MLflow 執行期間,您可以記錄模型參數和結果。 實驗是相關回合的集合。 在實驗中,您可以比較和篩選回合,以瞭解模型的執行方式,以及其效能如何取決於參數設定、輸入數據等等。
本文中的筆記本提供簡單的範例,可協助您快速開始使用 MLflow 來追蹤模型開發。 如需在 Azure Databricks 中使用 MLflow 追蹤的詳細資訊,請參閱 追蹤 ML 和深度學習定型執行。
注意
MLflow 追蹤不支援在作業 API 中使用 spark_submit_task 提交的作業。 相反地,您可以使用 MLflow 專案 來執行 Spark 程式代碼。
使用自動記錄來追蹤模型開發
MLflow 可以自動記錄以許多 ML 和深度學習架構撰寫的定型程式代碼。 這是開始使用 MLflow 追蹤的最簡單方式。
此範例筆記本示範如何搭配 scikit-learn 使用自動記錄。 如需使用其他 Python 連結庫自動記錄的資訊,請參閱 將定型執行自動記錄到 MLflow。
MLflow 自動記錄 Python 筆記本
使用記錄 API 來追蹤模型開發
此筆記本說明如何使用 MLflow 記錄 API。 使用記錄 API 可讓您更充分掌控記錄的計量,並可讓您記錄其他成品,例如數據表或繪圖。
此範例筆記本示範如何使用 Python 記錄 API。 MLflow 也有 REST、R 和 Java API。
MLflow 記錄 API Python 筆記本
端對端範例
本教學課程筆記本提供在 Azure Databricks 中訓練模型的端對端範例,包括載入數據、可視化數據、設定平行超參數優化,以及使用 MLflow 來檢閱結果、註冊模型,以及在 Spark UDF 中使用已註冊的模型對新數據執行推斷。
需求
Databricks Runtime ML
範例筆記本
如果您的工作區已啟用 Unity 目錄,請使用此版本的筆記本:
在 Databricks 上使用 scikit-learn 與 MLflow 整合 (Unity 目錄)
如果您的工作區未針對 Unity 目錄啟用,請使用此版本的筆記本:
在 Databricks 上使用 scikit-learn 與 MLflow 整合
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應