Konfigurieren von MLflow für die Modellnachverfolgung in Notebooks

Abgeschlossen

Als Data Scientist werden Sie ein Modell in einem Notebook entwickeln wollen, da Sie den Code auf diese Weise schnell testen und ausführen können.

Wenn Sie ein Modell trainieren, sollten die Ergebnisse reproduzierbar sein. Durch eine Nachverfolgung und Protokollierung können Sie Ihre Arbeit jederzeit überprüfen und entscheiden, welcher Ansatz für das Trainieren eines Modells am besten geeignet ist.

MLflow ist eine Open-Source-Bibliothek zur Nachverfolgung und Verwaltung Ihrer Machine Learning-Experimente. Insbesondere ist die MLflow-Nachverfolgung eine Komponente von MLflow, die umfassende Daten zum trainierten Modell protokolliert, darunter beispielsweise Parameter, Metriken und Artefakte.

Zur Verwendung von MLflow in Notebooks im Azure Machine Learning-Arbeitsbereich müssen Sie die erforderlichen Bibliotheken installieren und Azure Machine Learning als Speicher für die Nachverfolgung festlegen. Nach seiner Konfiguration können Sie MLflow für das Trainieren von Modellen in Notebooks verwenden.

Konfigurieren von MLflow in Notebooks

Sie können Notebooks in Azure Machine Learning oder auf einem lokalen Gerät erstellen und bearbeiten.

Verwenden von Azure Machine Learning-Notebooks

Im Azure Machine Learning-Arbeitsbereich können Sie Notebooks erstellen und diese mit einer von Azure Machine Learning verwalteten Compute-Instanz verbinden.

Wenn Sie ein Notebook auf einer Compute-Instanz ausführen, ist MLflow bereits konfiguriert und einsatzbereit.

Anhand des folgenden Codes können Sie überprüfen, ob die benötigten Pakete installiert sind:

pip show mlflow
pip show azureml-mlflow

Das mlflow-Paket ist die Open-Source-Bibliothek. Das Paket azureml-mlflow enthält den Code zur Integration von Azure Machine Learning und MLflow.

Verwenden von MLflow auf einem lokalen Gerät

Wenn Sie lieber in Notebooks auf einem lokalen Gerät arbeiten, können Sie ebenfalls MLflow verwenden. Sie müssen MLflow konfigurieren, indem Sie die folgenden Schritte ausführen:

  1. Installieren Sie die Pakete mlflow und azureml-mlflow.

    pip install mlflow
    pip install azureml-mlflow
    
  2. Navigieren Sie zu Azure Machine Learning Studio.

  3. Wählen Sie oben rechts in Studio den Namen des Arbeitsbereichs aus, an dem Sie gerade arbeiten.

  4. Wählen Sie Alle Eigenschaften im Azure-Portal anzeigen aus. Es wird eine neue Registerkarte geöffnet, die Sie zu Azure Machine Learning Service im Azure-Portal führt.

  5. Kopieren Sie den Wert für den MLflow-Nachverfolgungs-URI.

Screenshot of overview page in Azure portal showing the MLflow tracking URI.

  1. Verwenden Sie den folgenden Code in Ihrem lokalen Notebook, um MLflow so zu konfigurieren, dass auf den Azure Machine Learning-Arbeitsbereich verwiesen wird. Legen Sie außerdem den URI für die Nachverfolgung des Arbeitsbereichs fest.

    mlflow.set_tracking_uri = "MLFLOW-TRACKING-URI"
    

Tipp

Informieren Sie sich über alternative Ansätze zum Einrichten der Umgebung für die Nachverfolgung bei der Arbeit auf einem lokalen Gerät. Sie können zum Beispiel auch das Azure Machine Learning SDK v2 für Python zusammen mit der Konfigurationsdatei des Arbeitsbereichs verwenden, um den Nachverfolgungs-URI festzulegen.

Wenn Sie MLflow so konfiguriert haben, dass die Ergebnisse Ihres Modells nachverfolgt und in Ihrem Azure Machine Learning-Arbeitsbereich gespeichert werden, sind Sie bereit, in einem Notebook zu experimentieren.