Automatické přihlašování v Microsoft Fabric

Synapse Datová Věda v Microsoft Fabric zahrnuje automatické protokolování, což výrazně snižuje množství kódu potřebného k automatickému protokolování parametrů, metrik a položek modelu strojového učení během trénování. Tato funkce rozšiřuje možnosti automatickéhologování MLflow a je hluboce integrován do Datová Věda Synapse v prostředí Microsoft Fabric. Pomocí automatického přihlašování můžou vývojáři a datoví vědci snadno sledovat a porovnávat výkon různých modelů a experimentů bez nutnosti ručního sledování.

Konfigurace

Automatické zalogování funguje tak, že při trénování automaticky zachytí hodnoty vstupních parametrů, výstupních metrik a výstupních položek modelu strojového učení. Tyto informace se pak zaprotokolují do pracovního prostoru Microsoft Fabric, kde k němu můžete přistupovat a vizualizovat pomocí rozhraní API MLflow nebo odpovídajících položek experimentu a modelu v pracovním prostoru Microsoft Fabric.

Výchozí konfigurace pro háček mlflow.autolog() poznámkového bloku je:


mlflow.autolog(
    log_input_examples=False,
    log_model_signatures=True,
    log_models=True,
    disable=False,
    exclusive=True,
    disable_for_unsupported_versions=True,
    silent=True)

Když spustíte poznámkový blok Synapse Datová Věda, Microsoft Fabric zavolá mlflow.autolog() a okamžitě povolí sledování a načte odpovídající závislosti. Při trénování modelů v poznámkovém bloku se tyto informace o modelu automaticky sledují pomocí MLflow. Tato konfigurace se provádí automaticky na pozadí při spuštění import mlflow.

Podporované architektury

Automatické protokolování podporuje širokou škálu architektur strojového učení, včetně TensorFlow, PyTorch, Scikit-learn a XGBoost. Může zachytit celou řadu metrik, včetně přesnosti, ztráty a skóre F1 a také vlastních metrik definovaných uživatelem. Další informace o zachycených vlastnostech specifických pro architekturu najdete v dokumentaci K MLflow.

Přizpůsobení chování protokolování

K přizpůsobení chování protokolování můžete použít konfiguraci mlflow.autolog(). Tato konfigurace poskytuje parametry pro povolení protokolování modelu, shromažďování vstupních ukázek, konfiguraci upozornění nebo povolení protokolování pro uživatelem zadaný obsah.

Sledování dalšího obsahu

Konfiguraci automatického protokolování můžete aktualizovat tak, aby sledovala další metriky, parametry, soubory a metadata pomocí spuštění vytvořených pomocí MLflow.

Akce:

  1. Aktualizujte volání mlflow.autolog() a nastavte exclusive=False.

        mlflow.autolog(
        log_input_examples=False,
        log_model_signatures=True,
        log_models=True,
        disable=False,
        exclusive=False, # Update this property to enable custom logging
        disable_for_unsupported_versions=True,
        silent=True
    )
    
  2. Pomocí rozhraní API pro sledování MLflow můžete protokolovat další parametry a metriky. To vám umožní zachytit vlastní metriky a parametry a zároveň vám umožní používat automatické protokolování k zachycení dalších vlastností.

    Například:

    import mlflow
    mlflow.autolog(exclusive=False)
    
    with mlflow.start_run():
      mlflow.log_param("parameter name", "example value")
      # <add model training code here>
      mlflow.log_metric("metric name", 20)
    

Zakázání automatického protokolování Microsoft Fabric

Automatické protokolování Microsoft Fabric je možné zakázat pro konkrétní relaci poznámkového bloku nebo pro všechny poznámkové bloky pomocí nastavení pracovního prostoru.

Poznámka:

Pokud je automatické protokolování zakázané, uživatelé musí ručně protokolovat vlastní parametry a metriky pomocí rozhraní API MLflow.

Zakázání automatického protokolování pro relaci poznámkového bloku

Pokud chcete v relaci poznámkového bloku zakázat automatické protokolování Microsoft Fabric, můžete volat mlflow.autolog() a nastavit disable=True.

Příklad:

import mlflow
mlflow.autolog(disable=True)

Zakázání automatického protokolování pro pracovní prostor

Správci pracovního prostoru můžou povolit nebo zakázat automatické protokolování Microsoft Fabric pro všechny relace v rámci svého pracovního prostoru.

Akce:

  1. Přejděte do pracovního prostoru Synapse Datová Věda a vyberte Nastavení pracovního prostoru.

    Screenshot of the Data science item page.

  2. Na kartě Datoví technici/Věda vyberte Výpočetní prostředky Sparku. Tady najdete nastavení pro povolení nebo zakázání synapse Datová Věda automatického protokolování.

    Screenshot of the Data science Workspace setting for autologging.