Organizowanie przebiegów trenowania przy użyciu eksperymentów MLflow

Artykuł
03/22/2024

Eksperymenty to jednostki organizacji na potrzeby przebiegów trenowania modelu. Istnieją dwa typy eksperymentów: obszar roboczy i notes.

Eksperyment obszaru roboczego można utworzyć na podstawie interfejsu użytkownika usługi Databricks Machine Edukacja lub interfejsu API platformy MLflow. Eksperymenty obszaru roboczego nie są skojarzone z żadnym notesem, a każdy notes może rejestrować przebieg w tych eksperymentach przy użyciu identyfikatora eksperymentu lub nazwy eksperymentu.
Eksperyment notesu jest skojarzony z określonym notesem. Usługa Azure Databricks automatycznie tworzy eksperyment notesu, jeśli nie ma aktywnego eksperymentu po uruchomieniu przy użyciu mlflow.start_run().

Aby wyświetlić wszystkie eksperymenty w obszarze roboczym, do którego masz dostęp, wybierz pozycję Maszyny Edukacja > Eksperymenty na pasku bocznym.

Strona Eksperymenty

Tworzenie eksperymentu obszaru roboczego

W tej sekcji opisano sposób tworzenia eksperymentu obszaru roboczego przy użyciu interfejsu użytkownika usługi Azure Databricks. Eksperyment obszaru roboczego można utworzyć bezpośrednio z obszaru roboczego lub na stronie Eksperymenty.

Możesz również użyć interfejsu API platformy MLflow lub dostawcy narzędzia Terraform usługi Databricks z databricks_mlflow_experiment.

Aby uzyskać instrukcje dotyczące rejestrowania przebiegów do eksperymentów obszaru roboczego, zobacz Rejestrowanie przykładowego notesu.

Kliknij pozycję Obszar roboczy na pasku bocznym.
Przejdź do folderu, w którym chcesz utworzyć eksperyment.
Kliknij prawym przyciskiem myszy folder i wybierz pozycję Utwórz > eksperyment MLflow.
W oknie dialogowym Tworzenie eksperymentu MLflow wprowadź nazwę eksperymentu i opcjonalną lokalizację artefaktu. Jeśli nie określisz lokalizacji artefaktu, artefakty są przechowywane w programie dbfs:/databricks/mlflow-tracking/<experiment-id>.

Usługa Azure Databricks obsługuje lokalizacje artefaktów DBFS i Azure Blob Storage.

Aby przechowywać artefakty w usłudze Azure Blob Storage, określ identyfikator URI formularza wasbs://<container>@<storage-account>.blob.core.windows.net/<path>. Artefakty przechowywane w usłudze Azure Blob Storage nie są wyświetlane w interfejsie użytkownika platformy MLflow; należy je pobrać przy użyciu klienta usługi Blob Storage.

Uwaga

Podczas przechowywania artefaktu w lokalizacji innej niż DBFS artefakt nie jest wyświetlany w interfejsie użytkownika platformy MLflow. Modele przechowywane w lokalizacjach innych niż DBFS nie mogą być zarejestrowane w rejestrze modeli.
Kliknij pozycję Utwórz. Pojawi się pusty eksperyment.

Możesz również utworzyć nowy eksperyment obszaru roboczego na stronie Eksperymenty. Aby utworzyć nowy eksperyment, użyj menu rozwijanego tworzenie listy rozwijanej eksperymentu . Z menu rozwijanego możesz wybrać eksperyment automl lub pusty (pusty) eksperyment.

Eksperyment zautomatyzowanego uczenia maszynowego. Zostanie wyświetlona strona Konfigurowanie eksperymentu zautomatyzowanego uczenia maszynowego. Aby uzyskać informacje na temat używania rozwiązania AutoML, zobacz Trenowanie modeli uczenia maszynowego za pomocą interfejsu użytkownika rozwiązania AutoML usługi Azure Databricks.
Pusty eksperyment. Zostanie wyświetlone okno dialogowe Tworzenie eksperymentu MLflow. Wprowadź nazwę i opcjonalną lokalizację artefaktu w oknie dialogowym, aby utworzyć nowy eksperyment obszaru roboczego. Domyślną lokalizacją artefaktu jest dbfs:/databricks/mlflow-tracking/<experiment-id>.

Aby zalogować przebiegi do tego eksperymentu, wywołaj metodę mlflow.set_experiment() za pomocą ścieżki eksperymentu. Ścieżka eksperymentu jest wyświetlana w górnej części strony eksperymentu. Aby uzyskać szczegółowe informacje i przykładowy notes, zobacz Przykładowy notes rejestrowania.

Tworzenie eksperymentu notesu

Jeśli używasz polecenia mlflow.start_run() w notesie, uruchom metryki i parametry dzienników do aktywnego eksperymentu. Jeśli żaden eksperyment nie jest aktywny, usługa Azure Databricks tworzy eksperyment notesu. Eksperyment notesu ma taką samą nazwę i identyfikator, jak odpowiedni notes. Identyfikator notesu jest identyfikatorem liczbowym na końcu adresu URL i identyfikatora notesu.

Alternatywnie możesz przekazać ścieżkę obszaru roboczego usługi Azure Databricks do istniejącego notesu w mlflow.set_experiment(), aby utworzyć dla niego eksperyment notesu.

Aby uzyskać instrukcje dotyczące uruchamiania dzienników w eksperymentach notesu, zobacz Rejestrowanie przykładowego notesu.

Uwaga

Jeśli usuniesz eksperyment notesu przy użyciu interfejsu API (na przykład MlflowClient.tracking.delete_experiment() w języku Python), sam notes zostanie przeniesiony do folderu Kosz.

Wyświetlanie eksperymentów

Każdy eksperyment, do którego masz dostęp, jest wyświetlany na stronie eksperymentów. Na tej stronie możesz wyświetlić dowolny eksperyment. Kliknij nazwę eksperymentu, aby wyświetlić stronę eksperymentu.

Dodatkowe sposoby uzyskiwania dostępu do strony eksperymentu:

Dostęp do strony eksperymentu dla eksperymentu obszaru roboczego można uzyskać z menu obszaru roboczego.
Dostęp do strony eksperymentu dla eksperymentu notesu można uzyskać z notesu.

Aby wyszukać eksperymenty, wpisz tekst w polu Filtr eksperymentów i naciśnij klawisz Enter lub kliknij ikonę lupy. Lista eksperymentów zmienia się tak, aby pokazywała tylko te eksperymenty, które zawierają tekst wyszukiwania w kolumnie Name (Nazwa), Created by ( Utworzone według), Location (Lokalizacja) lub Description (Opis ).

Kliknij nazwę dowolnego eksperymentu w tabeli, aby wyświetlić jego stronę eksperymentu:

Wyświetlanie eksperymentu

Strona eksperymentu zawiera listę wszystkich przebiegów skojarzonych z eksperymentem. W tabeli możesz otworzyć stronę uruchamiania dla dowolnego przebiegu skojarzonego z eksperymentem, klikając jego nazwę uruchomienia. Kolumna Źródło zapewnia dostęp do wersji notesu, która utworzyła przebieg. Możesz również wyszukiwać i filtrować przebiegi według metryk lub ustawień parametrów.

Wyświetlanie eksperymentu obszaru roboczego

Kliknij pozycję Obszar roboczy na pasku bocznym.
Przejdź do folderu zawierającego eksperyment.
Kliknij nazwę eksperymentu.

Wyświetlanie eksperymentu notesu

Na prawym pasku bocznym notesu kliknij ikonę Eksperyment.

Zostanie wyświetlony pasek boczny Przebiegi eksperymentów z podsumowaniem każdego przebiegu skojarzonego z eksperymentem notesu, w tym parametrami przebiegu i metrykami. W górnej części paska bocznego znajduje się nazwa eksperymentu, do którego ostatnio zalogowany notes jest uruchamiany (eksperyment notesu lub eksperyment obszaru roboczego).

Wyświetlanie parametrów i metryk przebiegu

Na pasku bocznym możesz przejść do strony eksperymentu lub bezpośrednio do przebiegu.

Aby wyświetlić eksperyment, kliknij prawym przyciskiem myszy obok pozycji Przebiegi eksperymentów.
Aby wyświetlić przebieg, kliknij nazwę przebiegu.

Zarządzanie eksperymentami

Możesz zmienić nazwę, usunąć lub zarządzać uprawnieniami do eksperymentu, którego jesteś właścicielem ze strony eksperymentów, strony eksperymentu lub menu obszaru roboczego.

Uwaga

Nie można bezpośrednio zmienić nazwy, usunąć ani zarządzać uprawnieniami do eksperymentu MLflow utworzonego przez notes w folderze Git usługi Databricks. Te akcje należy wykonać na poziomie folderu Git.

Zmienianie nazwy eksperymentu na stronie eksperymentów lub na stronie eksperymentu

Ważne

Ta funkcja jest dostępna w publicznej wersji zapoznawczej.

Aby zmienić nazwę eksperymentu na stronie eksperymentów lub na stronie eksperymentu, kliknij i wybierz pozycję Zmień nazwę.

Kliknij pozycję Obszar roboczy na pasku bocznym.
Przejdź do folderu zawierającego eksperyment.
Kliknij prawym przyciskiem myszy nazwę eksperymentu i wybierz polecenie Zmień nazwę.

Kopiowanie nazwy eksperymentu

Aby skopiować nazwę eksperymentu, kliknij w górnej części strony eksperymentu. Możesz użyć tej nazwy w poleceniu set_experiment MLflow, aby ustawić aktywny eksperyment MLflow.

Ikona nazwy eksperymentu

Możesz również skopiować nazwę eksperymentu z paska bocznego eksperymentu w notesie.

Usuwanie eksperymentu notesu

Eksperymenty notesu są częścią notesu i nie można ich usunąć oddzielnie. Po usunięciu notesu skojarzony eksperyment notesu zostanie usunięty. Po usunięciu eksperymentu notesu przy użyciu interfejsu użytkownika notes zostanie również usunięty.

Aby usunąć eksperymenty notesu przy użyciu interfejsu API, użyj interfejsu API obszaru roboczego, aby upewnić się, że notes i eksperyment zostaną usunięte z obszaru roboczego.

Kliknij pozycję Obszar roboczy na pasku bocznym.
Przejdź do folderu zawierającego eksperyment.
Kliknij prawym przyciskiem myszy nazwę eksperymentu i wybierz polecenie Przenieś do kosza.

Usuwanie eksperymentu obszaru roboczego lub notesu ze strony eksperymentów lub strony eksperymentu

Ważne

Ta funkcja jest dostępna w publicznej wersji zapoznawczej.

Aby usunąć eksperyment ze strony eksperymentów lub strony eksperymentu, kliknij i wybierz pozycję Usuń.

Usunięcie eksperymentu notesu spowoduje również usunięcie notesu.

Zmienianie uprawnień do eksperymentu

Aby zmienić uprawnienia do eksperymentu na stronie eksperymentu, kliknij pozycję Udostępnij.

Przycisk Uprawnień strony eksperymentu

Możesz zmienić uprawnienia do eksperymentu, którego jesteś właścicielem na stronie eksperymentów. Kliknij kolumnę Akcje i wybierz pozycję Uprawnienie.

Aby uzyskać informacje na temat poziomów uprawnień eksperymentu, zobacz Listy ACL eksperymentu MLFlow.

Kopiowanie eksperymentów między obszarami roboczymi

Aby przeprowadzić migrację eksperymentów MLflow między obszarami roboczymi, możesz użyć projektu open source opartego na społeczności MLflow Export-Import.

Za pomocą tych narzędzi można wykonywać następujące czynności:

Udostępnianie i współpraca z innymi analitykami danych na tym samym lub innym serwerze śledzenia. Na przykład możesz sklonować eksperyment z innego użytkownika do obszaru roboczego.
Skopiuj eksperymenty MLflow i uruchom je z lokalnego serwera śledzenia do obszaru roboczego usługi Databricks.
Tworzenie kopii zapasowych eksperymentów i modeli o krytycznym znaczeniu dla innego obszaru roboczego usługi Databricks.