Model strojového učenia v službe Microsoft Fabric
Model strojového učenia je súbor trénovaný na rozpoznávanie určitých typov vzorov. Model trénujete na množine údajov a poskytujete k nemu algoritmus, ktorý používa na dozor a učenie sa z tejto množiny údajov. Po vytrénení modelu ho môžete použiť na odôvodnenie údajov, ktoré nikdy predtým nevidel, a na vytvorenie predpovedí o daných údajoch.
V toku MLflow môže model strojového učenia obsahovať viacero verzií modelu. V tomto príklade môže každá verzia predstavovať iteráciu modelu. V tomto článku sa dozviete, ako pracovať s modelmi strojového učenia na sledovanie a porovnanie verzií modelu.
Vytvorenie modelu strojového učenia
V toku strojového učenia modely strojového učenia obsahujú štandardný formát balenia. Tento formát umožňuje používať tieto modely v rôznych následných nástrojoch, vrátane dávkového odvodenia v Apache Spark. Formát definuje konvenciu na uloženie modelu v rôznych "konfiguráciách", ktoré rôzne následné nástroje dokážu pochopiť.
Z používateľského rozhrania služby Fabric môžete priamo vytvoriť model strojového učenia. Rozhranie API MLflow môže tiež priamo vytvoriť model.
Ak chcete vytvoriť model strojového učenia z používateľského rozhrania, môžete:
Vytvorte nový pracovný priestor dátovej vedy alebo vyberte existujúci pracovný priestor dátovej vedy.
V rozbaľovacej ponuke + Nový vyberte položku Model , čím vytvoríte prázdny model v pracovnom priestore dátovej vedy.
Po vytvorení modelu môžete začať pridávať verzie modelov a sledovať spúšťanie metrík a parametrov. Registrácia alebo uloženie spustení experimentov do existujúceho modelu.
Môžete tiež vytvoriť experiment strojového učenia priamo zo svojej skúsenosti s vytváraním pomocou rozhrania mlflow.register_model()
API. Ak registrovaný model strojového učenia s daným názvom neexistuje, rozhranie API ho automaticky vytvorí.
import mlflow
model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")
print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))
Správa verzií v rámci modelu strojového učenia
Model strojového učenia obsahuje kolekciu verzií modelov na zjednodušené sledovanie a porovnanie. V rámci modelu môže dátový vedec prechádzať rôznymi verziami modelov a skúmať základné parametre a metriky. Dátoví vedci môžu tiež porovnať verzie modelov, aby zistili, či novšie modely môžu alebo nemusia priniesť lepšie výsledky.
Sledovanie modelov strojového učenia
Verzia modelu strojového učenia predstavuje individuálny model, ktorý je zaregistrovaný na sledovanie.
Každá verzia modelu obsahuje nasledujúce informácie:
- Čas vytvorenia: Dátum a čas vytvorenia modelu.
- Názov spustenia: Identifikátor spustenia experimentu použitý na vytvorenie tejto konkrétnej verzie modelu.
- Hyperparametre: Hyperparametre sa ukladajú ako páry kľúča a hodnoty. Kľúče aj hodnoty sú reťazce.
- Metriky: Spustenie metrík uložených ako páry kľúč-hodnota. Hodnota je numerická.
- Schéma/podpis modelu: popis vstupov a výstupov modelu.
- Zaznamenané súbory: Súbory sa zapísali do denníka v ľubovoľnom formáte. Môžete napríklad zaznamenávať obrázky, prostredie, modely a údajové súbory.
Porovnanie a filtrovanie modelov strojového učenia
Ak chcete porovnať a vyhodnotiť kvalitu verzií modelu strojového učenia, môžete porovnať parametre, metriky a metaúdaje medzi vybratými verziami.
Vizuálne porovnanie modelov strojového učenia
Môžete vizuálne porovnať spustenia v rámci existujúceho modelu. Porovnávanie vizuálov umožňuje jednoduchú navigáciu medzi viacerými verziami a ich druhmi.
Ak chcete porovnať spustenia, môžete:
- Vyberte existujúci model strojového učenia, ktorý obsahuje viacero verzií.
- Vyberte kartu Zobrazenie a potom prejdite na zobrazenie zoznamu Model. Môžete tiež vybrať možnosť Zobraziť zoznam modelov priamo v zobrazení podrobností.
- Môžete prispôsobiť stĺpce v tabuľke. Rozbaľte tablu Prispôsobiť stĺpce. Odtiaľ môžete vybrať vlastnosti, metriky a hyperparametre, ktoré chcete zobraziť.
- Nakoniec môžete vybrať viacero verzií na porovnanie ich výsledkov na table porovnávania metrík. Na tejto table môžete prispôsobiť grafy so zmenami v názve grafu, type vizualizácie, osi x, osi y a ďalších.
Porovnanie modelov strojového učenia pomocou rozhrania API toku MLflow
Vedci pracujúci s údajmi môžu na vyhľadávanie medzi viacerými modelmi uloženými v pracovnom priestore použiť aj tok MLflow. Ak chcete zistiť ďalšie rozhrania API toku MLflow na interakciu modelu, pozrite si dokumentáciu k toku MLflow.
from pprint import pprint
client = MlflowClient()
for rm in client.list_registered_models():
pprint(dict(rm), indent=4)
Používanie modelov strojového učenia
Keď natrénujete model na množine údajov, môžete tento model použiť na údaje, ktoré nikdy nevidel na generovanie predpovedí. Tento model nazývame technika bodovania alebo odvodenia. Ďalšie informácie o bodovaní modelov služby Microsoft Fabric nájdete v ďalšej časti.