Aracılığıyla paylaş


MLflow verilerinizin depolandığı yeri seçin

MLflow izleme sunucuları deneme verilerinizi, çalıştırmalarınızı ve modellerinizi depolar ve yönetir. MLflow verilerinizin nerede depolandığını ve farklı ortamlardaki denemelere nasıl erişebileceğinizi denetlemek için izleme sunucularınızı yapılandırın.

Databricks tarafından barındırılan izleme sunucusu

Databricks varsayılan olarak şu yönetilen MLflow izleme sunucusu sağlar:

  • Ek kurulum veya yapılandırma gerektirmez
  • Deneme verilerini çalışma alanınızda depolar
  • Databricks not defterleri ve kümeleri ile sorunsuz bir şekilde tümleşir

Etkin denemeyi ayarlama

Varsayılan olarak tüm MLflow çalıştırmaları etkin deneme kullanılarak çalışma alanının izleme sunucusuna kaydedilir. Açıkça ayarlanmış bir deneme yoksa, çalıştırmalar not defteri denemesine kaydedilir.

Etkin denemeyi ayarlayarak Databricks'te çalıştırmaların günlüğe kaydedileceği yeri denetleyin:

Mlflow.set_experiment()

Yürütmede sonraki tüm çalıştırmalar için bir deneme ayarlayın.

import mlflow

mlflow.set_experiment("/Shared/my-experiment")

Mlflow.start_run()

Denemeyi belirli bir çalıştırma için ayarlayın.

with mlflow.start_run(experiment_id="12345"):
    mlflow.log_param("learning_rate", 0.01)

Ortam değişkenleri

Ortamdaki tüm çalıştırmalar için bir deneme ayarlayın.

import os
os.environ["MLFLOW_EXPERIMENT_NAME"] = "/Shared/my-experiment"
# or
os.environ["MLFLOW_EXPERIMENT_ID"] = "12345"

Uzak MLflow izleme sunucusuna izleme ayarlama

Uzak bir MLflow izleme sunucusuna bağlantı ayarlamanız gerekebilir. Bunun nedeni yerel olarak geliştirme yaptığınız ve Databricks barındırılan sunucusuna göre izlemek istemeniz veya farklı bir MLflow izleme sunucusuna izlemek istemeniz olabilir. Örneğin, farklı bir çalışma alanında yer alan bir çalışma alanı.

Uzaktan izleme için yaygın senaryolar:

Scenario Kullanım Örneği
Çalışma alanları arası izleme Birden çok çalışma alanında merkezi deneme izleme
Yerel geliştirme Databricks'te yerel olarak geliştirme ancak denemeleri izleme
Uzaktan şirket içinde barındırılan Belirli uyumluluk gereksinimlerine sahip özel MLflow altyapısı

İzleme URI'sini ayarlama ve deneme

Denemeleri bir uzaktan izleme sunucusuna günlüğe kaydetmek için hem izleme URI'sini hem de deneme yolunu yapılandırın:

import mlflow

# Set the tracking URI to the remote server
mlflow.set_tracking_uri("databricks://remote-workspace-url")

# Set the experiment path in the remote server
mlflow.set_experiment("/Shared/centralized-experiments/my-project")

# All subsequent runs will be logged to the remote server
with mlflow.start_run():
    mlflow.log_param("model_type", "random_forest")
    mlflow.log_metric("accuracy", 0.95)

Kimlik doğrulama yöntemleri

Uzaktan izleme sunucusu bağlantıları düzgün kimlik doğrulaması gerektirir. Hizmet sorumlularını kullanarak Kişisel Erişim Belirteçleri (PAT) veya OAuth arasında seçim yapın.

PAT

Basit belirteç tabanlı kimlik doğrulaması için PAT'leri kullanın.

Profesyonel: Basit kurulum, geliştirme için iyi

Eksi -lerini: Kullanıcıya özgü, el ile belirteç yönetimi gerektirir

import os

# Set authentication token
os.environ["DATABRICKS_TOKEN"] = "your-personal-access-token"

# Configure remote tracking
mlflow.set_tracking_uri("databricks://remote-workspace-url")
mlflow.set_experiment("/Shared/remote-experiment")

OAuth (hizmet sorumlusu)

Otomatik iş akışları için hizmet sorumlusu kimlik bilgileriyle OAuth kullanın.

Profesyonel: Otomasyon, merkezi kimlik yönetimi için daha iyi

Eksi -lerini: Hizmet sorumlusu kurulumu ve OAuth yapılandırması gerektirir

Hizmet sorumlusu oluşturma. Bkz. Hizmet sorumlularını yönetme.

import os

# Set service principal credentials
os.environ["DATABRICKS_CLIENT_ID"] = "your-service-principal-client-id"
os.environ["DATABRICKS_CLIENT_SECRET"] = "your-service-principal-secret"

# Configure remote tracking
mlflow.set_tracking_uri("databricks://remote-workspace-url")
mlflow.set_experiment("/Shared/remote-experiment")