Автоматическое логирование в Microsoft Fabric

Обработка и анализ данных Synapse в Microsoft Fabric включает функцию автоматического ведения журнала, которая значительно сокращает объем кода, необходимого для автоматического ведения журнала параметров, метрик и элементов модели машинного обучения во время обучения. Эта функция расширяет возможности автоматического логирования MLflow и глубоко интегрирована в Обработка и анализ данных Synapse в интерфейсе Microsoft Fabric. С помощью автоматического логирования разработчики и специалисты по обработке и анализу данных могут легко отслеживать и сравнивать производительность различных моделей и экспериментов без необходимости отслеживания вручную.

Важно!

Microsoft Fabric находится в предварительной версии.

Конфигурации

Автоматическая запись в журнал работает путем автоматического захвата значений входных параметров, выходных метрик и выходных элементов модели машинного обучения по мере ее обучения. Затем эти сведения записываются в рабочую область Microsoft Fabric, где их можно получить и визуализировать с помощью API MLflow или соответствующих элементов модели эксперимента & в рабочей области Microsoft Fabric.

По умолчанию для перехватчика записной книжки mlflow.autolog() используется следующая конфигурация:


mlflow.autolog(
    log_input_examples=False,
    log_model_signatures=True,
    log_models=True,
    disable=False,
    exclusive=True,
    disable_for_unsupported_versions=True,
    silent=True)

При запуске записной книжки Synapse Обработка и анализ данных Microsoft Fabric вызывает mlflow.autolog() для мгновенного включения отслеживания и загрузки соответствующих зависимостей. При обучении моделей в записной книжке эти сведения о модели автоматически отслеживаются с помощью MLflow. Эта настройка выполняется автоматически в фоновом режиме при запуске import mlflow.

Поддерживаемые платформы

Автоматическое ведения журнала поддерживает широкий спектр платформ машинного обучения, включая TensorFlow, PyTorch, Scikit-learn и XGBoost. Он может захватывать различные метрики, включая точность, потери и оценку F1, а также пользовательские метрики, определенные пользователем. Дополнительные сведения о свойствах конкретной платформы, которые записываются, см. в документации по MLflow.

Настройка поведения ведения журналов

Чтобы настроить поведение ведения журнала, можно использовать конфигурацию mlflow.autolog(). Эта конфигурация предоставляет параметры для включения ведения журнала модели, сбора входных примеров, настройки предупреждений или даже включения ведения журнала для пользовательского содержимого.

Отслеживание дополнительного содержимого

Вы можете обновить конфигурацию автоматического логирования для отслеживания дополнительных метрик, параметров, файлов и метаданных с помощью запусков, созданных с помощью MLflow.

Для этого выполните следующие действия.

  1. Обновите вызов mlflow.autolog() и задайте .exclusive=False

        mlflow.autolog(
        log_input_examples=False,
        log_model_signatures=True,
        log_models=True,
        disable=False,
        exclusive=False, # Update this property to enable custom logging
        disable_for_unsupported_versions=True,
        silent=True
    )
    
  2. Используйте API отслеживания MLflow для регистрации дополнительных параметров и метрик. Это позволяет записывать пользовательские метрики и параметры, а также использовать автоматическую запись в журнал для записи дополнительных свойств.

    Например:

    import mlflow
    mlflow.autolog(exclusive=False)
    
    with mlflow.start_run():
      mlflow.log_param("parameter name", "example value")
      # <add model training code here>
      mlflow.log_metric("metric name", 20)
    

Отключение автоматического логирования Microsoft Fabric

Автоматическую запись в Microsoft Fabric можно отключить для определенного сеанса записной книжки или во всех записных книжках с помощью параметра рабочей области.

Примечание

Если автоматическая запись в журнал отключена, пользователи должны вручную регистрируют собственные параметры и метрики с помощью API MLflow.

Отключение автоматического логирования для сеанса записной книжки

Чтобы отключить автоматическую запись в журнал Microsoft Fabric в сеансе записной книжки, можно вызвать mlflow.autolog() и задать .disable=True

Пример:

import mlflow
mlflow.autolog(disable=True)

Отключение автоматического логирования для рабочей области

Администраторы рабочей области могут включать или отключать автоматическую запись в журнал Microsoft Fabric для всех сеансов в своей рабочей области.

Для этого выполните следующие действия.

  1. Перейдите к рабочей области Synapse Обработка и анализ данных и выберите Параметры рабочей области.

    Снимок экрана: страница элемента обработки и анализа данных.

  2. На вкладке Инжиниринг данных/Science выберите Вычисление Spark. Здесь вы найдете параметр для включения или отключения synapse Обработка и анализ данных автоматического логирования.

    Снимок экрана: параметр рабочей области для обработки и анализа данных для автоматического ведения журнала.

Дальнейшие действия