Maskinlæringsmodell i Microsoft Fabric

En maskinlæringsmodell er en fil som er opplært til å gjenkjenne visse typer mønstre. Du lærer opp en modell over et sett med data, og du gir den en algoritme som bruker til å resonnere og lære av det datasettet. Når du har kalibrert modellen, kan du bruke den til å tenke over data som den aldri har sett før, og lage prognoser om disse dataene.

I MLflow kan en maskinlæringsmodell inneholde flere modellversjoner. Her kan hver versjon representere en modell gjentakelse. I denne artikkelen lærer du hvordan du samhandler med ML-modeller for å spore og sammenligne modellversjoner.

Opprette en maskinlæringsmodell

I MLflow inkluderer maskinlæringsmodeller et standard emballasjeformat. Dette formatet tillater bruk av disse modellene i ulike nedstrømsverktøy, inkludert batch-inferencing på Apache Spark. Formatet definerer en konvensjon for å lagre en modell i forskjellige "smaker" som ulike nedstrømsverktøy kan forstå.

Du kan opprette en maskinlæringsmodell direkte fra stoffgrensesnittet. MLflow-API-en kan også opprette modellen direkte.

Hvis du vil opprette en maskinlæringsmodell fra brukergrensesnittet, kan du:

  1. Opprett et nytt arbeidsområde for datavitenskap, eller velg et eksisterende arbeidsområde for datavitenskap.

  2. Velg Modell fra rullegardinlisten + Ny for å opprette en tom modell i arbeidsområdet for datavitenskap.

    Screenshot showing the New drop-down menu.

  3. Etter at modellen er opprettet, kan du begynne å legge til modellversjoner for å spore kjøring av måledata og parametere. Registrer eller lagre eksperimentkjøringer i en eksisterende modell.

Du kan også opprette et maskinlæringseksperiment direkte fra redigeringsopplevelsen med mlflow.register_model() API-en. Hvis en registrert maskinlæringsmodell med det angitte navnet ikke finnes, oppretter API-en den automatisk.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Administrere versjoner i en maskinlæringsmodell

En maskinlæringsmodell inneholder en samling modellversjoner for forenklet sporing og sammenligning. I en modell kan en dataforsker navigere på tvers av ulike modellversjoner for å utforske de underliggende parameterne og måledataene. Dataforskere kan også gjøre sammenligninger på tvers av modellversjoner for å identifisere om nyere modeller kan gi bedre resultater.

Spor maskinlæringsmodeller

En maskinlæringsmodellversjon representerer en individuell modell som er registrert for sporing.

Screenshot showing the details screen of a model.

Hver modellversjon inneholder følgende informasjon:

  • Tid opprettet: Dato og klokkeslett for oppretting av modell.
  • Kjørenavn: Identifikatoren for eksperimentet kjører som brukes til å opprette denne bestemte modellversjonen.
  • Hyperparametere: Hyperparametere lagres som nøkkelverdipar. Både nøkler og verdier er strenger.
  • Måledata: Kjør måledata som er lagret som nøkkelverdipar. Verdien er numerisk.
  • Modellskjema/signatur: En beskrivelse av modellens inndata og utdata.
  • Loggførte filer: Loggførte filer i alle formater. Du kan for eksempel ta opp bilder, miljø, modeller og datafiler.

Sammenligne og filtrere maskinlæringsmodeller

Hvis du vil sammenligne og evaluere kvaliteten på maskinlæringsmodellversjoner, kan du sammenligne parametere, måledata og metadata mellom valgte versjoner.

Sammenligne maskinlæringsmodeller visuelt

Du kan visuelt sammenligne kjøringer i en eksisterende modell. Visualobjektsammenligning gir enkel navigering mellom, og sorterer på tvers, flere versjoner.

Screenshot showing a list of runs for comparison.

Hvis du vil sammenligne kjøringer, kan du:

  1. Velg en eksisterende maskinlæringsmodell som inneholder flere versjoner.
  2. Velg Vis-fanen, og gå deretter til modelllistevisningen. Du kan også velge alternativet for å vise modelllisten direkte fra detaljvisningen.
  3. Du kan tilpasse kolonnene i tabellen. Utvid ruten Tilpass kolonner. Derfra kan du velge egenskapene, måledataene og hyperparameterne du vil se.
  4. Til slutt kan du velge flere versjoner, for å sammenligne resultatene, i måledatasammenligningsruten. Fra denne ruten kan du tilpasse diagrammene med endringer i diagramtittelen, visualiseringstypen, X-aksen, Y-aksen og mer.

Sammenligne maskinlæringsmodeller ved hjelp av API-en for MLflow

Dataforskere kan også bruke MLflow til å søke blant flere modeller som er lagret i arbeidsområdet. Gå til MLflow-dokumentasjonen for å utforske andre MLflow-API-er for modellsamhandling.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Bruke maskinlæringsmodeller

Når du har kalibrert en modell på et datasett, kan du bruke denne modellen på data den aldri så for å generere prognoser. Vi kaller denne modellen bruk teknikk scoring eller inferencing. Hvis du vil ha mer informasjon om Microsoft Fabric-modellpoeng, kan du se neste del.