此頁面說明如何建立 MLflow 實驗,並將開發環境連線到該實驗。
MLflow 實驗是 Gen AI 應用程式的容器。 在 實驗數據模型 概念指南中深入瞭解 MLflow 實驗。
移至與您的開發環境相關的區段:
本機開發環境
步驟 1:安裝 MLflow
使用 Databricks 連線安裝 MLflow:
pip install --upgrade "mlflow[databricks]>=3.1"
步驟 2:建立 MLflow 實驗
- 開啟您的 Databricks 工作區。
- 在左側提要欄位的 [AI/ML] 底下,按兩下 [ 實驗]。
- 在 [實驗] 頁面頂端,按兩下 [GenAI 應用程式和代理程式]。
步驟 3:設定驗證
備註
這些步驟說明如何使用 Databricks 個人存取令牌。 MLflow 也適用於其他 Databricks 支援的驗證方法。
選擇下列其中一個驗證方法:
環境變數
- 在您的 MLflow 實驗中,按兩下 [產生 API 金鑰]。
- 在終端機中複製並執行產生的程式代碼:
export DATABRICKS_TOKEN=<databricks-personal-access-token>
export DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
export MLFLOW_TRACKING_URI=databricks
export MLFLOW_EXPERIMENT_ID=<experiment-id>
.env 檔案
- 在您的 MLflow 實驗中,按兩下 [產生 API 金鑰]。
- 將產生的程式代碼複製到
.env
專案根目錄中的檔案:
DATABRICKS_TOKEN=<databricks-personal-access-token>
DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
MLFLOW_TRACKING_URI=databricks
MLFLOW_EXPERIMENT_ID=<experiment-id>
- 安裝
python-dotenv
套件:
pip install python-dotenv
- 在您的程式代碼中載入環境變數:
# At the beginning of your Python script
from dotenv import load_dotenv
# Load environment variables from .env file
load_dotenv()
步驟 4:驗證您的連線
建立測試檔案並執行此程式碼,以驗證您的連線,並將測試 追蹤 記錄至 MLflow 實驗:
import mlflow
import os
experiment_id = os.environ.get("MLFLOW_EXPERIMENT_ID")
databricks_host = os.environ.get("DATABRICKS_HOST")
mlflow_tracking_uri = os.environ.get("MLFLOW_TRACKING_URI")
if experiment_id is None or databricks_host is None or mlflow_tracking_uri is None:
raise Exception("Environment variables are not configured correctly.")
@mlflow.trace
def hello_mlflow(message: str):
hello_data = {
"experiment_url": f"{databricks_host}/mlflow/experiments/{experiment_id}",
"experiment_name": mlflow.get_experiment(experiment_id=experiment_id).name,
"message": message,
}
return hello_data
result = hello_mlflow("hello, world!")
print(result)
在 Databricks 裝載的筆記本中開發
步驟 1:建立筆記本
建立 Databricks Notebook 時,會同時建立一個 MLflow 實驗,作為您的 GenAI 應用程式的容器。 若要深入了解實驗,請參閱 數據模型。
- 開啟您的 Databricks 工作區。
- 移至左側提要欄位頂端的 [ 新增 ]。
- 按一下 筆記本。
步驟 2:安裝 MLflow
Databricks 運行時間包含 MLflow,但為了獲得最佳的 GenAI 功能體驗,請更新為最新版本:
%pip install --upgrade "mlflow[databricks]>=3.1"
dbutils.library.restartPython()
步驟 3:設定驗證
在 Databricks Notebook 內運作時,不需要額外的驗證設定。 筆記本會自動存取您的工作區和相關聯的 MLflow 實驗。
步驟 4:驗證您的連線
在筆記本數據格中執行此程式碼,以確認您的連線。 您會看到 MLflow 追蹤出現在您的筆記本單元格底下。
import mlflow
import os
@mlflow.trace
def hello_mlflow(message: str):
hello_data = {
"message": message,
}
return hello_data
result = hello_mlflow("hello, world!")
print(result)
後續步驟
使用這些建議的動作和教學課程繼續您的旅程。
- 利用追蹤功能配置您的應用程式 (IDE) - 在本機 IDE 中將 MLflow 追蹤功能新增至您的 GenAI 應用程式
- 在應用程式中加入追蹤功能(筆記本) - 在 Databricks 筆記本中新增 MLflow 追蹤功能
- 評估應用程式的品質 - 有系統地測試及改善應用程式的品質
參考指南
查看本指南中提到的概念和功能的詳細文件。
- MLflow 實驗 - 瞭解 GenAI 應用程式的實驗容器
- 追蹤概念 - 瞭解 MLflow 追蹤的基本概念
- Databricks 驗證 - 查看所有可用的驗證方式