Rozpocznij pracę z eksperymentami platformy MLflow

W tej kolekcji notesów pokazano, jak można uruchomić eksperyment MLflow.

Składniki MLflow

MLflow to platforma typu „open source” umożliwiająca zarządzanie całym cyklem życia uczenia maszynowego. MLflow ma trzy podstawowe składniki:

  • Śledzenie
  • Modele
  • Projekty

Składnik MLflow Tracking umożliwia rejestrowanie i wykonywanie zapytań dotyczących sesji trenowania modelu maszynowego (przebiegów) przy użyciu następujących interfejsów API:

Przebieg platformy MLflow to zbiór parametrów, metryk, tagów i artefaktów skojarzonych z procesem trenowania modelu uczenia maszynowego.

Co to są eksperymenty w środowisku MLflow?

Eksperymenty są podstawową jednostką organizacji w rozwiązaniu MLflow. Wszystkie przebiegi MLflow należą do eksperymentu. Każdy eksperyment umożliwia wizualizowanie, wyszukiwanie i porównywanie przebiegów, a także pobieranie artefaktów przebiegu lub metadanych na potrzeby analizy w innych narzędziach. Eksperymenty są przechowywane na serwerze śledzenia MLflow hostowanym w usłudze Azure Databricks.

Eksperymenty znajdują się w drzewie plików obszaru roboczego . Eksperymenty są zarządzane przy użyciu tych samych narzędzi, których używasz do zarządzania innymi obiektami obszaru roboczego, takimi jak foldery, notesy i biblioteki.

Przykładowe notesy MLflow

W poniższych notesach pokazano, jak utworzyć i zalogować się do przebiegu platformy MLflow przy użyciu interfejsów API śledzenia MLflow, a także jak używać interfejsu użytkownika eksperymentu do wyświetlania przebiegu. Te notesy są dostępne w językach Python, Scala i R.

Notesy języka Python i języka R korzystają z eksperymentu notesu. Notes Scala tworzy eksperyment w folderze Shared .

Uwaga

W przypadku środowiska Databricks Runtime 10.4 LTS ML i nowszych funkcja automatycznego rejestrowania usługi Databricks jest domyślnie włączona dla notesów języka Python.