Autologning i Microsoft Fabric

Synapse Data Science i Microsoft Fabric inkluderer autologning, hvilket markant reducerer mængden af kode, der kræves for automatisk at logge parametre, metrikker og elementer i en maskinlæringsmodel under træning. Denne artikel beskriver autologning for Synapse Data Science i Microsoft Fabric.

Autologging udvider MLflow Tracking funktioner og er dybt integreret i Synapse Data Science i Microsoft Fabric oplevelse. Automatisk logning kan registrere forskellige målepunkter, herunder nøjagtighed, tab, F1-score og brugerdefinerede målepunkter, som du definerer. Ved hjælp af autologging kan udviklere og datateknikere nemt spore og sammenligne ydeevnen af forskellige modeller og eksperimenter uden manuel sporing.

Understøttede strukturer

Autologging understøtter en lang række strukturer til maskinel indlæring, herunder TensorFlow, PyTorch, Scikit-learn og XGBoost. Du kan få mere at vide om de strukturspecifikke egenskaber, der registreres automatisk, i dokumentationen til MLflow.

Konfiguration

Automatisk logning fungerer ved automatisk at registrere værdier for inputparametre, outputmetrik og outputelementer i en model til maskinel indlæring, efterhånden som den oplæres. Disse oplysninger logges i dit Microsoft Fabric-arbejdsområde, hvor du kan få adgang til og visualisere det ved at bruge MLflow API'erne eller de tilsvarende eksperiment- og modelelementer i dit Microsoft Fabric-arbejdsområde.

Når du starter en Synapse Data Science-notesbog, kalder Microsoft Fabric mlflow.autolog() for øjeblikkeligt at aktivere sporing og indlæse de tilsvarende afhængigheder. Når du oplærer modeller i din notesbog, sporer MLflow automatisk disse modeloplysninger.

Konfigurationen sker automatisk i baggrunden, når du kører import mlflow. Standardkonfigurationen for notesbogen mlflow.autolog() hook er:


mlflow.autolog(
    log_input_examples=False,
    log_model_signatures=True,
    log_models=True,
    log_datasets=True,
    log_traces=True,
    disable=False,
    exclusive=True,
    disable_for_unsupported_versions=True,
    silent=True,
    extra_tags=None,
    exclude_flavors=None
)

Tilpasning

For at tilpasse logadfærden, brug mlflow.autolog() -konfigurationen. Denne konfiguration indeholder parametre, der aktiverer modellogføring, indsamler inputeksempler, konfigurerer advarsler eller aktiverer logføring for tilføjet indhold, som du angiver.

Spor flere målepunkter, parametre og egenskaber

For runs, du opretter ved at bruge MLflow, opdater MLflows autologing-konfiguration for at spore ekstra metrikker, parametre, filer og metadata:

  1. Opdater kaldet mlflow.autolog() for at angive exclusive=False.

        mlflow.autolog(
        log_input_examples=False,
        log_model_signatures=True,
        log_models=True,
        log_datasets=True,
        log_traces=True,
        disable=False,
        exclusive=False, # Update this property to enable custom logging
        disable_for_unsupported_versions=True,
        silent=True,
        extra_tags=None,
        exclude_flavors=None
    )
    
  2. Brug MLflow-tracking-API'erne til at logge ekstra parametre og metrikker. Følgende eksempelkode viser, hvordan du logger dine brugerdefinerede metrikker og parametre sammen med ekstra egenskaber.

    import mlflow
    mlflow.autolog(exclusive=False)
    
    with mlflow.start_run():
      mlflow.log_param("parameter name", "example value")
      # <add model training code here>
      mlflow.log_metric("metric name", 20)
    

Deaktiver Microsoft Fabric autologning

Du kan deaktivere Microsoft Fabric-autolog for en specifik notebook-session. Du kan også deaktivere automatisklogging på tværs af alle notesbøger ved hjælp af indstillingen for arbejdsområdet.

Seddel

Hvis automatisk logføring er deaktiveret, skal du manuelt logføre dine parametre og målepunkter ved hjælp af MLflow-API'erne.

Deaktiver automatisk logning for en notesbogsession

For at deaktivere Microsoft Fabric autolog for en specifik notesbogssession, kald mlflow.autolog() og sæt disable=True.

import mlflow
mlflow.autolog(disable=True)

Deaktiver automatisk logning for alle notesbøger og sessioner

Arbejdsområdeadministratorer kan aktivere eller deaktivere Microsoft Fabric-autologning for alle notesbøger og sessioner i deres arbejdsområde ved at bruge arbejdsområdeindstillingerne. Sådan aktiverer eller deaktiverer du automatisk logning af Synapse Data Science:

  1. Vælg Indstillinger for arbejdsområdei arbejdsområdet.

    Skærmbillede af arbejdsområde med indstillinger for arbejdsområde fremhævet.

  2. I indstillinger for arbejdsområdeskal du udvide Data Engineering/Science på navigationslinjen til venstre og vælge Spark-indstillinger.

  3. I Spark-indstillingerskal du vælge fanen Automatisk log .

  4. Angiv Spor automatisk eksperimenter og modeller til maskinel indlæring for at ved eller fra.

  5. Vælg Save.

    Skærmbillede af indstillingen for automatisk logning i arbejdsområdet.