Udostępnij za pośrednictwem


Model uczenia maszynowego w usłudze Microsoft Fabric

Model uczenia maszynowego to plik wyszkolony do rozpoznawania niektórych typów wzorców. Wytrenujesz model na zestawie danych i udostępnisz go algorytmowi, który używa do wnioskowania i uczenia się z tego zestawu danych. Po wytrenowania modelu możesz użyć go do wnioskowania o danych, których nigdy wcześniej nie widział, i przewidywania dotyczące tych danych.

W środowisku MLflow model uczenia maszynowego może zawierać wiele wersji modelu. W tym miejscu każda wersja może reprezentować iterację modelu. Z tego artykułu dowiesz się, jak wchodzić w interakcje z modelami uczenia maszynowego w celu śledzenia i porównywania wersji modelu.

Tworzenie modelu uczenia maszynowego

W środowisku MLflow modele uczenia maszynowego obejmują standardowy format pakowania. Ten format umożliwia korzystanie z tych modeli w różnych narzędziach podrzędnych, w tym wnioskowanie wsadowe na platformie Apache Spark. Format definiuje konwencję zapisywania modelu w różnych "smakach", które mogą zrozumieć różne narzędzia podrzędne.

Możesz bezpośrednio utworzyć model uczenia maszynowego z poziomu interfejsu użytkownika sieci szkieletowej. Interfejs API platformy MLflow może również bezpośrednio utworzyć model.

Aby utworzyć model uczenia maszynowego na podstawie interfejsu użytkownika, możesz:

  1. Utwórz nowy obszar roboczy nauki o danych lub wybierz istniejący obszar roboczy nauki o danych.

  2. Z listy rozwijanej + Nowy wybierz pozycję Model , aby utworzyć pusty model w obszarze roboczym nauki o danych.

    Screenshot showing the New drop-down menu.

  3. Po utworzeniu modelu można rozpocząć dodawanie wersji modelu w celu śledzenia metryk i parametrów przebiegu. Rejestrowanie lub zapisywanie przebiegów eksperymentów w istniejącym modelu.

Możesz również utworzyć eksperyment uczenia maszynowego bezpośrednio z poziomu środowiska tworzenia za pomocą interfejsu mlflow.register_model() API. Jeśli zarejestrowany model uczenia maszynowego o podanej nazwie nie istnieje, interfejs API utworzy go automatycznie.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Zarządzanie wersjami w modelu uczenia maszynowego

Model uczenia maszynowego zawiera kolekcję wersji modelu na potrzeby uproszczonego śledzenia i porównywania. W ramach modelu analityk danych może nawigować po różnych wersjach modelu, aby zapoznać się z podstawowymi parametrami i metrykami. Analitycy danych mogą również porównać różne wersje modelu, aby ustalić, czy nowsze modele mogą przynieść lepsze wyniki.

Śledzenie modeli uczenia maszynowego

Wersja modelu uczenia maszynowego reprezentuje pojedynczy model zarejestrowany do śledzenia.

Screenshot showing the details screen of a model.

Każda wersja modelu zawiera następujące informacje:

  • Godzina utworzenia: data i godzina utworzenia modelu.
  • Nazwa przebiegu: identyfikator przebiegów eksperymentu używany do utworzenia tej konkretnej wersji modelu.
  • Hiperparametry: hiperparametry są zapisywane jako pary klucz-wartość. Zarówno klucze, jak i wartości są ciągami.
  • Metryki: uruchom metryki zapisane jako pary klucz-wartość. Wartość jest liczbowa.
  • Schemat/podpis modelu: opis danych wejściowych i wyjściowych modelu.
  • Zarejestrowane pliki: zarejestrowane pliki w dowolnym formacie. Można na przykład rejestrować obrazy, środowisko, modele i pliki danych.

Porównywanie i filtrowanie modeli uczenia maszynowego

Aby porównać i ocenić jakość wersji modelu uczenia maszynowego, możesz porównać parametry, metryki i metadane między wybranymi wersjami.

Wizualne porównywanie modeli uczenia maszynowego

Możesz wizualnie porównać przebiegi w istniejącym modelu. Porównanie wizualne umożliwia łatwe nawigowanie między różnymi wersjami i sortowanie między nimi.

Screenshot showing a list of runs for comparison.

Aby porównać przebiegi, możesz:

  1. Wybierz istniejący model uczenia maszynowego zawierający wiele wersji.
  2. Wybierz kartę Widok , a następnie przejdź do widoku listy Model. Możesz również wybrać opcję Wyświetl listę modeli bezpośrednio z widoku szczegółów.
  3. Kolumny w tabeli można dostosować. Rozwiń okienko Dostosowywanie kolumn. W tym miejscu możesz wybrać właściwości, metryki i hiperparametry, które chcesz zobaczyć.
  4. Na koniec możesz wybrać wiele wersji, aby porównać ich wyniki w okienku porównania metryk. W tym okienku można dostosować wykresy ze zmianami w tytule wykresu, typem wizualizacji, osią X, osią Y i nie tylko.

Porównanie modeli uczenia maszynowego przy użyciu interfejsu API platformy MLflow

Analitycy danych mogą również używać biblioteki MLflow do wyszukiwania między wieloma modelami zapisanymi w obszarze roboczym. Zapoznaj się z dokumentacją platformy MLflow, aby zapoznać się z innymi interfejsami API platformy MLflow na potrzeby interakcji z modelem.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Stosowanie modeli uczenia maszynowego

Po wytrenowania modelu w zestawie danych można zastosować ten model do danych, które nigdy nie widziały w celu wygenerowania przewidywań. Nazywamy ten model techniką oceniania lub wnioskowania. Aby uzyskać więcej informacji na temat oceniania modelu usługi Microsoft Fabric, zobacz następną sekcję.