Model uczenia maszynowego w usłudze Microsoft Fabric

Model uczenia maszynowego to plik wyszkolony do rozpoznawania niektórych typów wzorców. Wytrenujesz model za pomocą zestawu danych i udostępnisz go algorytmowi, który używa do rozumowania i uczenia się z tego zestawu danych. Po wytrenowania modelu możesz użyć go do wnioskowania o danych, których nigdy wcześniej nie widział, i przewidywania dotyczące tych danych.

Ważne

Usługa Microsoft Fabric jest dostępna w wersji zapoznawczej.

W usłudze MLflow model uczenia maszynowego może zawierać wiele wersji modelu. W tym miejscu każda wersja może reprezentować iterację modelu. Z tego artykułu dowiesz się, jak korzystać z modeli uczenia maszynowego w celu śledzenia i porównywania wersji modelu.

Tworzenie modelu

W usłudze MLflow modele uczenia maszynowego obejmują standardowy format pakowania. Ten format umożliwia korzystanie z tych modeli w różnych narzędziach podrzędnych, w tym wnioskowanie wsadowe na platformie Apache Spark. Format definiuje konwencję zapisywania modelu w różnych "smakach", które mogą zrozumieć różne narzędzia podrzędne.

Środowisko użytkownika może bezpośrednio utworzyć model uczenia maszynowego na podstawie środowiska użytkownika. Interfejs API platformy MLflow może również bezpośrednio utworzyć model uczenia maszynowego.

Aby utworzyć model uczenia maszynowego na podstawie środowiska użytkownika, możesz:

  1. Utwórz nowy obszar roboczy nauki o danych lub wybierz istniejący obszar roboczy nauki o danych.

  2. Z listy rozwijanej + Nowy wybierz pozycję Model. Spowoduje to utworzenie pustego modelu w obszarze roboczym nauki o danych.

    Zrzut ekranu przedstawiający menu rozwijane Nowy.

  3. Po utworzeniu modelu możesz rozpocząć dodawanie wersji modelu w celu śledzenia metryk i parametrów uruchamiania. Rejestrowanie lub zapisywanie przebiegów eksperymentów w istniejącym modelu.

Możesz również utworzyć eksperyment uczenia maszynowego bezpośrednio z poziomu środowiska tworzenia przy użyciu interfejsu mlflow.register_model() API. Jeśli zarejestrowany model o podanej nazwie nie istnieje, interfejs API tworzy go automatycznie.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Zarządzanie wersjami w modelu

Model uczenia maszynowego zawiera kolekcję wersji modelu na potrzeby uproszczonego śledzenia i porównywania. W ramach modelu analityk danych może nawigować po różnych wersjach modelu, aby zapoznać się z podstawowymi parametrami i metrykami. Analitycy danych mogą również porównać różne wersje modelu, aby określić, czy nowsze modele mogą przynieść lepsze wyniki.

Śledzenie modeli

Wersja modelu uczenia maszynowego reprezentuje pojedynczy model, który został zarejestrowany do śledzenia.

Zrzut ekranu przedstawiający ekran szczegółów modelu.

Każda wersja modelu zawiera następujące informacje:

  • Godzina utworzenia: data i godzina utworzenia modelu.
  • Nazwa uruchomienia: identyfikator przebiegów eksperymentu używany do utworzenia tej konkretnej wersji modelu.
  • Hiperparametry: Hiperparametry są zapisywane jako pary klucz-wartość. Zarówno klucze, jak i wartości są ciągami.
  • Metryki: uruchom metryki zapisane jako pary klucz-wartość. Wartość jest liczbowa.
  • Schemat/podpis modelu: opis danych wejściowych i wyjściowych modelu.
  • Zarejestrowane pliki: zarejestrowane pliki w dowolnym formacie. Można na przykład rejestrować obrazy, środowisko, modele i pliki danych.

Porównywanie i filtrowanie modeli

Aby porównać i ocenić jakość wersji modelu uczenia maszynowego, możesz porównać parametry, metryki i metadane między wybranymi wersjami.

Wizualne porównywanie modeli

Możesz wizualnie porównać przebiegi w istniejącym modelu. Umożliwia to łatwą nawigację między różnymi wersjami i sortowaniem.

Zrzut ekranu przedstawiający listę przebiegów do porównania.

Aby porównać przebiegi, możesz wykonać następujące czynności:

  1. Wybierz istniejący model uczenia maszynowego zawierający wiele wersji.
  2. Wybierz kartę Widok , a następnie przejdź do widoku listy Model . Możesz również wybrać opcję Wyświetl listę modeli bezpośrednio z widoku szczegółów.
  3. Możesz dostosować kolumny w tabeli. Rozwiń okienko Dostosowywanie kolumn . W tym miejscu możesz wybrać właściwości, metryki i hiperparametry, które chcesz zobaczyć.
  4. Na koniec możesz wybrać wiele wersji, aby porównać ich wyniki w okienku porównania metryk. W tym okienku można dostosować wykresy ze zmianami tytułu wykresu, typem wizualizacji, osią X, osią Y i nie tylko.

Porównanie modeli przy użyciu interfejsu API MLflow

Analitycy danych mogą również używać platformy MLflow do wyszukiwania między wieloma modelami zapisanymi w obszarze roboczym. Zapoznaj się z dokumentacją platformy MLflow , aby zapoznać się z innymi interfejsami API platformy MLflow na potrzeby interakcji z modelem.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Zastosuj model

Po wytrenowania modelu w zestawie danych możesz zastosować ten model do danych, które nigdy nie widziały w celu wygenerowania przewidywań. Nazywamy ten model techniką oceniania lub wnioskowania. Aby uzyskać więcej informacji na temat oceniania modelu usługi Microsoft Fabric, zobacz następną sekcję.

Następne kroki