使用 MLflow 追蹤模型開發

發行項
05/03/2024

本文包含 Azure Databricks 中追蹤模型開發的範例。使用 MLflow 自動記錄和追蹤 ML 和深度學習模型，或使用 MLflow API 手動進行。

模型追蹤和 MLflow

模型開發程式是反覆的，當您開發和優化模型時，追蹤您的工作可能會很困難。在 Azure Databricks 中，您可以使用 MLflow 追蹤來協助您追蹤模型開發程式，包括您嘗試的參數設定或組合，以及它們如何影響模型的效能。

MLflow 追蹤會使用實驗和執行來記錄和追蹤您的 ML 和深度學習模型開發。執行是模型程式代碼的單一執行。在 MLflow 執行期間，您可以記錄模型參數和結果。實驗是相關回合的集合。在實驗中，您可以比較和篩選回合，以瞭解模型的執行方式，以及其效能如何取決於參數設定、輸入數據等等。

本文中的筆記本提供簡單的範例，可協助您快速開始使用 MLflow 來追蹤模型開發。如需在 Azure Databricks 中使用 MLflow 追蹤的詳細資訊，請參閱追蹤 ML 和深度學習定型執行。

注意

MLflow 追蹤不支援在作業 API 中使用 spark_submit_task 提交的作業。相反地，您可以使用 MLflow 專案來執行 Spark 程式代碼。

使用自動記錄來追蹤模型開發

MLflow 可以自動記錄以許多 ML 和深度學習架構撰寫的定型程式代碼。這是開始使用 MLflow 追蹤的最簡單方式。

此範例筆記本示範如何搭配 scikit-learn 使用自動記錄。如需使用其他 Python 連結庫自動記錄的資訊，請參閱將定型執行自動記錄到 MLflow。

MLflow 自動記錄 Python 筆記本

取得筆記本

使用記錄 API 來追蹤模型開發

此筆記本說明如何使用 MLflow 記錄 API。使用記錄 API 可讓您更充分掌控記錄的計量，並可讓您記錄其他成品，例如數據表或繪圖。

此範例筆記本示範如何使用 Python 記錄 API。 MLflow 也有 REST、R 和 Java API。

MLflow 記錄 API Python 筆記本

取得筆記本

端對端範例

本教學課程筆記本提供在 Azure Databricks 中訓練模型的端對端範例，包括載入數據、可視化數據、設定平行超參數優化，以及使用 MLflow 來檢閱結果、註冊模型，以及在 Spark UDF 中使用已註冊的模型對新數據執行推斷。

需求

Databricks Runtime ML

範例筆記本

如果您的工作區已啟用 Unity 目錄，請使用此版本的筆記本：

在 Databricks 上使用 scikit-learn 與 MLflow 整合（Unity 目錄）

取得筆記本

如果您的工作區未針對 Unity 目錄啟用，請使用此版本的筆記本：

在 Databricks 上使用 scikit-learn 與 MLflow 整合

取得筆記本

共用方式為

使用 MLflow 追蹤模型開發

模型追蹤和 MLflow

使用自動記錄來追蹤模型開發

MLflow 自動記錄 Python 筆記本

使用記錄 API 來追蹤模型開發

MLflow 記錄 API Python 筆記本

端對端範例

需求

範例筆記本

在 Databricks 上使用 scikit-learn 與 MLflow 整合（Unity 目錄）

在 Databricks 上使用 scikit-learn 與 MLflow 整合

意見反應

意見反應

其他資源

共用方式為

使用 MLflow 追蹤模型開發

模型追蹤和 MLflow

使用自動記錄來追蹤模型開發

MLflow 自動記錄 Python 筆記本

使用記錄 API 來追蹤模型開發

MLflow 記錄 API Python 筆記本

端對端範例

需求

範例筆記本

在 Databricks 上使用 scikit-learn 與 MLflow 整合 （Unity 目錄）

在 Databricks 上使用 scikit-learn 與 MLflow 整合

意見反應

意見反應

其他資源

在 Databricks 上使用 scikit-learn 與 MLflow 整合（Unity 目錄）