Model til maskinel indlæring i Microsoft Fabric

En model til maskinel indlæring er en fil, der er oplært i at genkende visse typer mønstre. Du oplærer en model over et sæt data, og du giver den en algoritme, der bruger til at begrunde og lære af dette datasæt. Når du har oplært modellen, kan du bruge den til at begrunde data, som den aldrig har set før, og foretage forudsigelser om disse data.

Vigtigt

Microsoft Fabric er i øjeblikket i PRØVEVERSION. Disse oplysninger relaterer til et foreløbig produkt, der kan ændres væsentligt, før de udgives. Microsoft giver ingen garantier, udtrykt eller stiltiende, med hensyn til de oplysninger, der er angivet her.

I MLflow kan en model til maskinel indlæring indeholde flere modelversioner. Her kan hver version repræsentere en model iteration. I denne artikel lærer du, hvordan du interagerer med modeller til maskinel indlæring for at spore og sammenligne modelversioner.

Opret en model

I MLflow omfatter modeller til maskinel indlæring et standardemballageformat. Dette format gør det muligt at bruge disse modeller i forskellige downstreamværktøjer, herunder batchafledering på Apache Spark. Formatet definerer en konvention til lagring af en model i forskellige "smagsvarianter", som forskellige downstreamværktøjer kan forstå.

Brugeroplevelsen kan direkte oprette en model til maskinel indlæring ud fra brugeroplevelsen. MLflow-API'en kan også oprette en model til maskinel indlæring direkte.

Hvis du vil oprette en model til maskinel indlæring ud fra brugeroplevelsen, kan du:

  1. Opret et nyt arbejdsområde til datavidenskab, eller vælg et eksisterende datavidenskabsarbejdsområde.

  2. Vælg Model på rullelisten + Ny. Dette opretter en tom model i dit datavidenskabsarbejdsområde.

    Skærmbillede, der viser rullemenuen Ny.

  3. Når modellen er oprettet, kan du begynde at tilføje modelversioner for at spore kørselsdata og parametre. Registrer eller gem eksperimentkørsler i en eksisterende model.

Du kan også oprette et maskinlæringseksperiment direkte fra din oprettelsesoplevelse med API'en mlflow.register_model() . Hvis der ikke findes en registreret model med det angivne navn, opretter API'en den automatisk.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Administrer versioner i en model

En model til maskinel indlæring indeholder en samling modelversioner til forenklet sporing og sammenligning. I en model kan en datatekniker navigere på tværs af forskellige modelversioner for at udforske de underliggende parametre og målepunkter. Dataeksperter kan også foretage sammenligninger på tværs af modelversioner for at identificere, om nyere modeller kan give bedre resultater.

Spor modeller

En version af en model til maskinel indlæring repræsenterer en individuel model, der er registreret til sporing.

Skærmbillede, der viser detaljeskærmen for en model.

Hver modelversion indeholder følgende oplysninger:

  • Tid oprettet: Dato og klokkeslæt for oprettelse af model.
  • Kørselsnavn: Id'et for de eksperimentkørsler, der bruges til at oprette denne specifikke modelversion.
  • Hyperparameters: Hyperparameters gemmes som nøgleværdipar. Både nøgler og værdier er strenge.
  • Målepunkter: Kør målepunkter, der er gemt som nøgleværdipar. Værdien er numerisk.
  • Modelskema/signatur: En beskrivelse af modelinput og -output.
  • Logførte filer: Logførte filer i et hvilket som helst format. Du kan f.eks. optage billeder, miljø, modeller og datafiler.

Sammenlign og filtrer modeller

Hvis du vil sammenligne og evaluere kvaliteten af modeller til maskinel indlæring, kan du sammenligne parametrene, målepunkterne og metadataene mellem de valgte versioner.

Sammenlign modeller visuelt

Du kan visuelt sammenligne kørsler i en eksisterende model. Dette gør det nemt at navigere mellem og sortere på tværs af flere versioner.

Skærmbillede, der viser en liste over kørsler til sammenligning.

Hvis du vil sammenligne kørsler, kan du:

  1. Vælg en eksisterende model til maskinel indlæring, der indeholder flere versioner.
  2. Vælg fanen Vis , og naviger derefter til listevisningen Model . Du kan også vælge indstillingen Vis modelliste direkte fra detaljevisningen.
  3. Du kan tilpasse kolonnerne i tabellen. Udvid ruden Tilpas kolonner . Herfra kan du vælge de egenskaber, målepunkter og hyperparametre, du vil se.
  4. Endelig kan du vælge flere versioner for at sammenligne deres resultater i ruden til sammenligning af målepunkter. I denne rude kan du tilpasse diagrammerne med ændringer af diagramtitlen, visualiseringstypen, X-aksen, Y-aksen og meget mere.

Sammenlign modeller ved hjælp af MLflow-API'en

Dataeksperter kan også bruge MLflow til at søge efter flere modeller, der er gemt i arbejdsområdet. Besøg dokumentationen til MLflow for at udforske andre MLflow-API'er til modelinteraktion.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Anvend modellen

Når du har oplært en model på et datasæt, kan du anvende denne model på data, som den aldrig har set for at generere forudsigelser. Vi kalder denne model brug teknik scoring eller inferencing. Du kan få flere oplysninger om microsoft Fabric-modelscore i næste afsnit.

Næste trin