Maskinlæringsmodell i Microsoft Fabric
En maskinlæringsmodell er en fil som er opplært til å gjenkjenne visse typer mønstre. Du lærer opp en modell over et sett med data, og du gir den en algoritme som bruker til å resonnere og lære av dette datasettet. Når du har kalibrert modellen, kan du bruke den til å tenke over data som den aldri har sett før, og lage prognoser om disse dataene.
Viktig
Microsoft Fabric er for øyeblikket i FORHÅNDSVERSJON. Denne informasjonen er knyttet til et forhåndsutgitt produkt som kan endres vesentlig før det utgis. Microsoft gir ingen garantier, uttrykt eller underforstått, med hensyn til informasjonen som er oppgitt her.
I MLflow kan en maskinlæringsmodell inkludere flere modellversjoner. Her kan hver versjon representere en modell iterasjon. I denne artikkelen lærer du hvordan du samhandler med maskinlæringsmodeller for å spore og sammenligne modellversjoner.
Opprette en modell
I MLflow inkluderer maskinlæringsmodeller et standard emballasjeformat. Dette formatet tillater bruk av disse modellene i ulike nedstrømsverktøy, inkludert satsvis utheving av Apache Spark. Formatet definerer en konvensjon for å lagre en modell i ulike "smaker" som ulike nedstrømsverktøy kan forstå.
Brukeropplevelsen kan opprette en maskinlæringsmodell direkte fra brukeropplevelsen. MLflow-API-en kan også opprette en maskinlæringsmodell direkte.
Hvis du vil opprette en maskinlæringsmodell fra brukeropplevelsen, kan du:
Opprett et nytt arbeidsområde for datavitenskap, eller velg et eksisterende arbeidsområde for datavitenskap.
Velg Modell fra rullegardinlisten + Ny. Dette oppretter en tom modell i arbeidsområdet for datavitenskap.
Etter at modellen er opprettet, kan du begynne å legge til modellversjoner for å spore kjøring av måledata og parametere. Registrer eller lagre eksperimentkjøringer til en eksisterende modell.
Du kan også opprette et maskinlæringseksperiment direkte fra redigeringsopplevelsen med mlflow.register_model()
API-en. Hvis en registrert modell med det angitte navnet ikke finnes, oppretter API-en den automatisk.
import mlflow
model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")
print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))
Behandle versjoner i en modell
En maskinlæringsmodell inneholder en samling modellversjoner for forenklet sporing og sammenligning. I en modell kan en dataforsker navigere på tvers av ulike modellversjoner for å utforske de underliggende parameterne og måledataene. Dataforskere kan også gjøre sammenligninger på tvers av modellversjoner for å identifisere om nyere modeller kan gi bedre resultater.
Spor modeller
En maskinlæringsmodellversjon representerer en individuell modell som er registrert for sporing.
Hver modellversjon inneholder følgende informasjon:
- Opprettelsestidspunkt: Dato og klokkeslett for oppretting av modell.
- Kjørenavn: Identifikatoren for eksperimentkjøringene som brukes til å opprette denne bestemte modellversjonen.
- Hyperparametere: Hyperparametere lagres som nøkkelverdipar. Både nøkler og verdier er strenger.
- Måledata: Kjør måledata lagret som nøkkelverdipar. Verdien er numerisk.
- Modellskjema/signatur: En beskrivelse av modellens inndata og utdata.
- Loggførte filer: Loggførte filer i alle formater. Du kan for eksempel ta opp bilder, miljø, modeller og datafiler.
Sammenlign og filtrer modeller
Hvis du vil sammenligne og evaluere kvaliteten på maskinlæringsmodellversjoner, kan du sammenligne parametere, måledata og metadata mellom valgte versjoner.
Sammenligne modeller visuelt
Du kan visuelt sammenligne kjøringer i en eksisterende modell. Dette gir enkel navigering mellom, og sorterer på tvers, flere versjoner.
Hvis du vil sammenligne kjøringer, kan du:
- Velg en eksisterende maskinlæringsmodell som inneholder flere versjoner.
- Velg Vis-fanen , og gå deretter til modelllistevisningen . Du kan også velge alternativet for å vise modelllisten direkte fra detaljvisningen.
- Du kan tilpasse kolonnene i tabellen. Utvid ruten Tilpass kolonner . Derfra kan du velge egenskapene, måledataene og hyperparameterne du vil se.
- Til slutt kan du velge flere versjoner, for å sammenligne resultatene, i sammenligningsruten for måledata. Fra denne ruten kan du tilpasse diagrammene med endringer i diagramtittelen, visualiseringstypen, X-aksen, Y-aksen og mer.
Sammenligne modeller ved hjelp av MLflow-API-en
Dataforskere kan også bruke MLflow til å søke blant flere modeller som er lagret i arbeidsområdet. Gå til MLflow-dokumentasjonen for å utforske andre MLflow-API-er for modellsamhandling.
from pprint import pprint
client = MlflowClient()
for rm in client.list_registered_models():
pprint(dict(rm), indent=4)
Bruk modellen
Når du lærer opp en modell på et datasett, kan du bruke denne modellen på data den aldri så for å generere prognoser. Vi kaller denne modellen for bruk av teknikkpoeng ellerinferencing. Hvis du vil ha mer informasjon om poengberegning for Microsoft Fabric-modellen, kan du se neste del.