Självstudie: Ansluta utvecklingsmiljön till MLflow

Den här sidan visar hur du skapar ett MLflow-experiment och ansluter utvecklingsmiljön till den.

Ett MLflow-experiment är containern för ditt GenAI-program. Läs mer om MLflow-experiment i konceptguiden för experimentdatamodellen .

Gå till avsnittet som är relevant för din utvecklingsmiljö:

Lokal utvecklingsmiljö

Steg 1: Installera MLflow

Installera MLflow med Databricks-anslutning:

pip install --upgrade "mlflow[databricks]>=3.1"

Steg 2: Skapa ett MLflow-experiment

  1. Öppna Databricks-arbetsytan.
  2. I det vänstra sidofältet, under AI/ML, klickar du på Experiment.
  3. Längst upp på sidan Experiment klickar du på GenAI-appar och agenter.

skapa experiment

Steg 3: Konfigurera autentisering

Anmärkning

De här stegen beskriver hur du använder en Personlig åtkomsttoken för Databricks. MLflow fungerar också med andra autentiseringsmetoder som stöds av Databricks.

Välj någon av följande autentiseringsmetoder:

Miljövariabler

  1. I din MLflow-experiment klickar du på Kebab-menyn Kebabmenyikonen.> Logga lokalt> klicka på Generera API-nyckel.
  2. Kopiera och kör den genererade koden i terminalen:
export DATABRICKS_TOKEN=<databricks-personal-access-token>
export DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
export MLFLOW_TRACKING_URI=databricks
export MLFLOW_REGISTRY_URI=databricks-uc
export MLFLOW_EXPERIMENT_ID=<experiment-id>

.env-fil

  1. I din MLflow-experiment klickar du på Kebab-menyn Kebabmenyikonen.> Logga lokalt> klicka på Generera API-nyckel.
  2. Kopiera den genererade koden till en .env fil i projektroten:
DATABRICKS_TOKEN=<databricks-personal-access-token>
DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
MLFLOW_TRACKING_URI=databricks
MLFLOW_REGISTRY_URI=databricks-uc
MLFLOW_EXPERIMENT_ID=<experiment-id>
  1. Installera python-dotenv-paketet:
pip install python-dotenv
  1. Läs in miljövariabler i koden:
# At the beginning of your Python script
from dotenv import load_dotenv

# Load environment variables from .env file
load_dotenv()

Steg 4: Verifiera anslutningen

Skapa en testfil och kör den här koden för att verifiera anslutningen och logga en testspårning till MLflow-experimentet:

import mlflow
import os

experiment_id = os.environ.get("MLFLOW_EXPERIMENT_ID")
databricks_host = os.environ.get("DATABRICKS_HOST")
mlflow_tracking_uri = os.environ.get("MLFLOW_TRACKING_URI")

if experiment_id is None or databricks_host is None or mlflow_tracking_uri is None:
    raise Exception("Environment variables are not configured correctly.")

@mlflow.trace
def hello_mlflow(message: str):

    hello_data = {
        "experiment_url": f"{databricks_host}/mlflow/experiments/{experiment_id}",
        "experiment_name": mlflow.get_experiment(experiment_id=experiment_id).name,
        "message": message,
    }
    return hello_data

result = hello_mlflow("hello, world!")
print(result)

hello mlflow

Utveckla i en Databricks-värdbaserad anteckningsbok

Steg 1: Skapa en anteckningsbok

När du skapar en Databricks Notebook skapas ett MLflow-experiment som är containern för ditt GenAI-program. Mer information om experiment finns i datamodellen.

  1. Öppna Databricks-arbetsytan.
  2. Gå till Nytt överst i det vänstra sidofältet.
  3. Klicka på Anteckningsbok.

Steg 2: Installera MLflow

Databricks-runtimes inkluderar MLflow, men för bästa möjliga upplevelse med GenAI-funktioner uppdaterar du till den senaste versionen:

%pip install --upgrade "mlflow[databricks]>=3.1"
dbutils.library.restartPython()

Steg 3: Konfigurera autentisering

Ingen ytterligare autentiseringskonfiguration krävs när du arbetar i en Databricks Notebook. Anteckningsboken har automatiskt åtkomst till din arbetsyta och det associerade MLflow-experimentet.

Steg 4: Verifiera anslutningen

Kör den här koden i en notebook-cell för att verifiera anslutningen. Du kommer att se ett MLflow-spår dyka upp under notebook-cellen.

import mlflow
import os

@mlflow.trace
def hello_mlflow(message: str):
    hello_data = {
        "message": message,
    }
    return hello_data

result = hello_mlflow("hello, world!")
print(result)

hello mlflow notebook-cell

Nästa steg

Referensguider

Mer information om begrepp och funktioner i den här guiden finns i: