Model strojového učení v Microsoft Fabric

Model strojového učení je soubor natrénovaný tak, aby rozpoznal určité typy vzorů. Model vytrénujete přes sadu dat a poskytnete mu algoritmus, který zdůvodní a učí se z této datové sady. Jakmile model vytrénujete, můžete ho použít k odůvodnění nad daty, která předtím neviděla, a vytvářet předpovědi o datech.

V MLflow může model strojového učení obsahovat více verzí modelu. Každá verze zde může představovat iteraci modelu. V tomto článku se dozvíte, jak pracovat s modely ML a sledovat a porovnávat verze modelů.

Vytvoření modelu strojového učení

Modely strojového učení v MLflow zahrnují standardní formát balení. Tento formát umožňuje použití těchto modelů v různých podřízených nástrojích, včetně dávkového odvozování v Apache Sparku. Formát definuje konvenci pro uložení modelu v různých "příchutích", kterým můžou různé podřízené nástroje rozumět.

Model strojového učení můžete přímo vytvořit z uživatelského rozhraní Fabric. Rozhraní API MLflow může také přímo vytvořit model.

Pokud chcete vytvořit model strojového učení z uživatelského rozhraní, můžete:

  1. Vytvořte nový pracovní prostor datové vědy nebo vyberte existující pracovní prostor datové vědy.

  2. V rozevíracím seznamu + Nový vyberte Model a vytvořte prázdný model v pracovním prostoru datové vědy.

    Screenshot showing the New drop-down menu.

  3. Po vytvoření modelu můžete začít přidávat verze modelu, abyste mohli sledovat metriky a parametry spuštění. Zaregistrujte nebo uložte spuštění experimentu do existujícího modelu.

Experiment strojového učení můžete také vytvořit přímo z prostředí pro vytváření pomocí mlflow.register_model() rozhraní API. Pokud zaregistrovaný model strojového učení s daným názvem neexistuje, rozhraní API ho vytvoří automaticky.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Správa verzí v rámci modelu strojového učení

Model strojového učení obsahuje kolekci verzí modelu pro zjednodušené sledování a porovnání. V rámci modelu může datový vědec procházet různé verze modelu a zkoumat základní parametry a metriky. Datoví vědci můžou také provádět porovnání mezi verzemi modelu, aby zjistili, jestli novější modely můžou přinést lepší výsledky.

Sledování modelů strojového učení

Verze modelu strojového učení představuje jednotlivý model, který je zaregistrovaný ke sledování.

Screenshot showing the details screen of a model.

Každá verze modelu obsahuje následující informace:

  • Čas vytvoření: Datum a čas vytvoření modelu.
  • Název spuštění: Identifikátor spuštění experimentu, který se používá k vytvoření této konkrétní verze modelu.
  • Hyperparametry: Hyperparametry se ukládají jako páry klíč-hodnota. Klíče i hodnoty jsou řetězce.
  • Metriky: Spusťte metriky uložené jako páry klíč-hodnota. Hodnota je číselná.
  • Schéma nebo podpis modelu: Popis vstupů a výstupů modelu.
  • Protokolované soubory: Protokolované soubory v libovolném formátu. Můžete například zaznamenávat obrázky, prostředí, modely a datové soubory.

Porovnání a filtrování modelů strojového učení

Pokud chcete porovnat a vyhodnotit kvalitu verzí modelu strojového učení, můžete porovnat parametry, metriky a metadata mezi vybranými verzemi.

Vizuální porovnání modelů strojového učení

Můžete vizuálně porovnat spuštění v rámci existujícího modelu. Vizuální porovnání umožňuje snadnou navigaci mezi různými verzemi a řazením.

Screenshot showing a list of runs for comparison.

Pokud chcete porovnat spuštění, můžete:

  1. Vyberte existující model strojového učení, který obsahuje více verzí.
  2. Vyberte kartu Zobrazení a pak přejděte do zobrazení seznamu modelů. Můžete také vybrat možnost Zobrazit seznam modelů přímo ze zobrazení podrobností.
  3. Sloupce v tabulce můžete přizpůsobit. Rozbalte podokno Přizpůsobit sloupce. Odtud můžete vybrat vlastnosti, metriky a hyperparametry, které chcete zobrazit.
  4. Nakonec můžete vybrat více verzí a porovnat jejich výsledky v podokně porovnání metrik. V tomto podokně můžete grafy přizpůsobit změnami názvu grafu, typu vizualizace, osy X, osy Y a dalších možností.

Porovnání modelů strojového učení pomocí rozhraní API MLflow

Datoví vědci mohou také použít MLflow k vyhledávání mezi několika modely uloženými v pracovním prostoru. Navštivte dokumentaci K MLflow a prozkoumejte další rozhraní API MLflow pro interakci modelu.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Použití modelů strojového učení

Jakmile model vytrénujete na sadě dat, můžete ho použít na data, která nikdy neviděla ke generování předpovědí. Tento model nazýváme metodou bodování nebo odvozování. Další informace o bodování modelu Microsoft Fabric najdete v další části.