共用方式為


快速入門:將您的開發環境連線到 MLflow

此頁面說明如何建立 MLflow 實驗,並將開發環境連線到該實驗。

MLflow 實驗是 Gen AI 應用程式的容器。 在 實驗數據模型 概念指南中深入瞭解 MLflow 實驗。

移至與您的開發環境相關的區段:

  1. 在 IDE 或筆記本中本地執行
  2. Databricks 提供的筆記本環境

本機開發環境

步驟 1:安裝 MLflow

使用 Databricks 連線安裝 MLflow:

pip install --upgrade "mlflow[databricks]>=3.1"

步驟 2:建立 MLflow 實驗

  1. 開啟您的 Databricks 工作區。
  2. 在左側提要欄位的 [AI/ML] 底下,按兩下 [ 實驗]。
  3. 在 [實驗] 頁面頂端,按兩下 [GenAI 應用程式和代理程式]。

建立實驗

步驟 3:設定驗證

備註

這些步驟說明如何使用 Databricks 個人存取令牌。 MLflow 也適用於其他 Databricks 支援的驗證方法

選擇下列其中一個驗證方法:

環境變數

  1. 在您的 MLflow 實驗中,按兩下 [產生 API 金鑰]。
  2. 在終端機中複製並執行產生的程式代碼:
export DATABRICKS_TOKEN=<databricks-personal-access-token>
export DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
export MLFLOW_TRACKING_URI=databricks
export MLFLOW_EXPERIMENT_ID=<experiment-id>

.env 檔案

  1. 在您的 MLflow 實驗中,按兩下 [產生 API 金鑰]。
  2. 將產生的程式代碼複製到 .env 專案根目錄中的檔案:
DATABRICKS_TOKEN=<databricks-personal-access-token>
DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
MLFLOW_TRACKING_URI=databricks
MLFLOW_EXPERIMENT_ID=<experiment-id>
  1. 安裝 python-dotenv 套件:
pip install python-dotenv
  1. 在您的程式代碼中載入環境變數:
# At the beginning of your Python script
from dotenv import load_dotenv

# Load environment variables from .env file
load_dotenv()

步驟 4:驗證您的連線

建立測試檔案並執行此程式碼,以驗證您的連線,並將測試 追蹤 記錄至 MLflow 實驗:

import mlflow
import os

experiment_id = os.environ.get("MLFLOW_EXPERIMENT_ID")
databricks_host = os.environ.get("DATABRICKS_HOST")
mlflow_tracking_uri = os.environ.get("MLFLOW_TRACKING_URI")

if experiment_id is None or databricks_host is None or mlflow_tracking_uri is None:
    raise Exception("Environment variables are not configured correctly.")

@mlflow.trace
def hello_mlflow(message: str):

    hello_data = {
        "experiment_url": f"{databricks_host}/mlflow/experiments/{experiment_id}",
        "experiment_name": mlflow.get_experiment(experiment_id=experiment_id).name,
        "message": message,
    }
    return hello_data

result = hello_mlflow("hello, world!")
print(result)

hello mlflow

在 Databricks 裝載的筆記本中開發

步驟 1:建立筆記本

建立 Databricks Notebook 時,會同時建立一個 MLflow 實驗,作為您的 GenAI 應用程式的容器。 若要深入了解實驗,請參閱 數據模型

  1. 開啟您的 Databricks 工作區。
  2. 移至左側提要欄位頂端的 [ 新增 ]。
  3. 按一下 筆記本

步驟 2:安裝 MLflow

Databricks 運行時間包含 MLflow,但為了獲得最佳的 GenAI 功能體驗,請更新為最新版本:

%pip install --upgrade "mlflow[databricks]>=3.1"
dbutils.library.restartPython()

步驟 3:設定驗證

在 Databricks Notebook 內運作時,不需要額外的驗證設定。 筆記本會自動存取您的工作區和相關聯的 MLflow 實驗。

步驟 4:驗證您的連線

在筆記本數據格中執行此程式碼,以確認您的連線。 您會看到 MLflow 追蹤出現在您的筆記本單元格底下。

import mlflow
import os

@mlflow.trace
def hello_mlflow(message: str):
    hello_data = {
        "message": message,
    }
    return hello_data

result = hello_mlflow("hello, world!")
print(result)

hello mlflow

後續步驟

使用這些建議的動作和教學課程繼續您的旅程。

參考指南

查看本指南中提到的概念和功能的詳細文件。