Отслеживание экспериментов машинного обучения Azure Synapse Analytics с помощью MLflow и Машинного обучения Azure

Статья
09/02/2024

В этой статье описано, как включить MLflow для подключения к Машинному обучению Azure при работе в рабочей области Azure Synapse Analytics. Эту конфигурацию можно использовать для отслеживания, управления моделями и развертывания моделей.

MLflow — это библиотека с открытым кодом для управления жизненным циклом экспериментов машинного обучения. MLFlow Tracking — это компонент MLflow, который осуществляет мониторинг и ведение журнала метрик выполнения обучения и артефактов моделей. См. дополнительные сведения об MLflow.

Если вам нужно обучить проект MLflow с помощью Машинного обучения Azure, ознакомьтесь со статьей Обучение моделей машинного обучения с помощью проектов MLflow и Машинного обучения Azure (предварительная версия).

Необходимые компоненты

Установка библиотек

Чтобы установить библиотеки в выделенном кластере в Azure Synapse Analytics:

Создайте файл requirements.txt с пакетами, которые требуются для ваших экспериментов, но убедитесь, что он также включает следующие пакеты:

requirements.txt
```
mlflow
azureml-mlflow
azure-ai-ml
```
Перейдите на портал рабочей области Azure Analytics.
Перейдите на вкладку Управление и выберите Пулы Apache Spark.
Щелкните три точки рядом с именем кластера и выберите Пакеты.
В разделе Файлы требований щелкните Отправить.
Отправьте файл requirements.txt.
Дождитесь перезапуска кластера.

Отслеживание экспериментов с помощью потока ML

Azure Synapse Analytics можно настроить для отслеживания экспериментов с помощью MLflow в рабочей области Машинного обучения Azure. Машинное обучение Azure предоставляет централизованный репозиторий для управления жизненным циклом экспериментов, моделей и развертываний. Преимущество этого решения состоит также в том, что оно упрощает развертывание с помощью вариантов развертывания Машинного обучения Azure.

Настройка записных книжек для использования MLflow с подключением к Машинному обучению Azure

Чтобы применять Машинное обучение Azure в качестве централизованного репозитория для экспериментов, можно использовать MLflow. В каждой записной книжке, над которой вы работаете, необходимо настроить URI отслеживания, чтобы он указывал на используемую рабочую область. В следующем примере показано, как это можно сделать.

Настройка URI отслеживания

Получите URI отслеживания для рабочей области:
ОБЛАСТЬ ПРИМЕНЕНИЯ: расширение машинного обучения Azure CLI версии 2 (текущее)
1. Войдите и настройте рабочую область:
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. URI отслеживания можно получить с помощью az ml workspace команды:
```
az ml workspace show --query mlflow_tracking_uri
```
ОБЛАСТЬ ПРИМЕНЕНИЯ: Пакет SDK для Python azure-ai-ml версии 2 (current)

Вы можете получить URI отслеживания MLflow для Azure ML с помощью пакета SDK для Машинного обучения Azure версии 2 для Python. Убедитесь, что у вас установлена библиотека azure-ai-ml в используемом вычислении. В следующем примере возвращается уникальный URI отслеживания MLFLow, связанный с рабочей областью.
1. Войдите в рабочую область с помощью .MLClient Проще сделать это с помощью файла конфигурации рабочей области:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  Совет
  
  Вы можете скачать файл конфигурации рабочей области следующим способом:
  
  Перейдите в Студию машинного обучения Azure
  
  Щелкните правый верхний угол страницы —> скачайте файл конфигурации.
  
  Сохраните файл config.json в том же каталоге, с которым вы работаете.
2. Кроме того, можно использовать идентификатор подписки, имя группы ресурсов и имя рабочей области, чтобы получить его:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  Внимание
  
  DefaultAzureCredential попытается извлечь учетные данные из доступного контекста. Если вы хотите указать учетные данные другим способом, например, используя веб-браузер в интерактивном режиме, вы можете использовать InteractiveBrowserCredential или любой другой метод, доступный в пакете azure.identity.
3. Получите URI отслеживания Машинное обучение Azure:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Используйте портал Машинное обучение Azure для получения URI отслеживания:
1. Откройте портал Студия машинного обучения Azure и войдите с помощью учетных данных.
2. В правом верхнем углу щелкните имя рабочей области, чтобы отобразить колонку "Каталог + подписка + рабочая область ".
3. Щелкните "Просмотреть все свойства" на портале Azure.
4. В разделе Essentials вы найдете универсальный код ресурса (URI) отслеживания MLflow.
URI отслеживания для Машинного обучения Azure можно создать с помощью идентификатора подписки, региона, в котором развернут ресурс, имени группы ресурсов и имени рабочей области. В следующем примере кода показано, как:

Предупреждение

Если вы работаете в рабочей области с поддержкой приватного канала, конечная точка MLflow также будет использовать приватный канал для связи с Машинное обучение Azure. В результате URI отслеживания будет выглядеть иначе, как показано здесь. Для этих случаев необходимо получить URI отслеживания с помощью пакета SDK машинного обучения Azure или CLI версии 2.
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Настройка URI отслеживания:
- с помощью MLflow;
- Использование переменных среды
Затем метод set_tracking_uri() указывает этот URI в качестве URI отслеживания MLFLow.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
Переменные среды MLflow можно задать MLFLOW_TRACKING_URI в вычислительных ресурсах, чтобы сделать любое взаимодействие с MLflow в этом вычислении, чтобы они указывали по умолчанию на Машинное обучение Azure.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Совет

При работе с общими средами, например в кластере Azure Databricks, кластере Azure Synapse Analytics или аналогичном, рекомендуется настроить переменную MLFLOW_TRACKING_URI среды на уровне кластера, чтобы автоматически настроить URI отслеживания MLflow, чтобы указывать на Машинное обучение Azure для всех сеансов, выполняемых в кластере, а не для каждого сеанса.

Настройка проверки подлинности

После настройки отслеживания необходимо также настроить, как проверка подлинности должна произойти с связанной рабочей областью. По умолчанию подключаемый модуль Машинное обучение Azure для MLflow будет выполнять интерактивную проверку подлинности, открыв браузер по умолчанию для запроса учетных данных. Сведения о настройке MLflow для Машинное обучение Azure: настройте проверку подлинности для дополнительных способов настройки проверки подлинности для MLflow в Машинное обучение Azure рабочих областях.

Для интерактивных заданий, в которых есть пользователь, подключенный к сеансу, можно полагаться на интерактивную проверку подлинности, поэтому дальнейшие действия не требуются.

Предупреждение

Интерактивная проверка подлинности браузера блокирует выполнение кода при запросе учетных данных. Этот подход не подходит для проверки подлинности в автоматических средах, таких как задания обучения. Рекомендуется настроить другой режим проверки подлинности.

Для таких сценариев, когда требуется автоматическое выполнение, необходимо настроить субъект-службу для взаимодействия с Машинное обучение Azure.

Пакет SDK для MLflow
Использование переменных среды

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

Совет

При работе с общими средами рекомендуется настроить эти переменные среды на вычислительных ресурсах. Рекомендуется управлять ими в качестве секретов в экземпляре Azure Key Vault.

Например, в Azure Databricks можно использовать секреты в переменных среды, как показано в конфигурации кластера. AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}} Дополнительные сведения о реализации этого подхода в Azure Databricks см. в статье "Справочник по секрету в переменной среды" или в документации по вашей платформе.

Имена экспериментов в Машинном обучении Azure

По умолчанию Машинное обучение Azure отслеживает выполнение в эксперименте по умолчанию, который называется Default. Обычно рекомендуется настроить эксперимент, над которым вы собираетесь работать. Используйте следующий синтаксис, чтобы задать имя эксперимента:

mlflow.set_experiment(experiment_name="experiment-name")

Отслеживание параметров, метрик и артефактов

Затем вы можете использовать MLflow в Azure Synapse Analytics так же, как и раньше. Дополнительные сведения см. в разделе "Журнал и просмотр метрик" и файлов журналов.

Регистрация моделей в реестре с помощью MLflow

Модели можно зарегистрировать в рабочей области Машинного обучения Azure, которая предлагает централизованный репозиторий для управления их жизненным циклом. В следующем примере модель, обученная с помощью Spark MLLib, записывается в журнал и регистрируется в реестре.

mlflow.spark.log_model(model, 
                       artifact_path = "model", 
                       registered_model_name = "model_name")

Если зарегистрированная модель с именем не существует, метод регистрирует новую модель, создает версию 1 и возвращает объект ModelVersion MLflow.
Если зарегистрированная модель с таким именем уже существует, метод создает новую версию модели и возвращает объект Version.

Вы можете управлять моделями, зарегистрированными в Машинном обучении Azure, с помощью MLflow. Дополнительные сведения см. в статье Управление реестрами моделей в Машинном обучении Azure с помощью MLflow.

Развертывание и использование моделей, зарегистрированных в Машинном обучении Azure

Модели, зарегистрированные в службе "Машинное обучение Azure" с помощью MLflow, могут использоваться следующим образом:

Конечная точка Машинного обучения Azure (для использования в реальном времени и в пакетном режиме): это развертывание позволяет использовать возможности развертывания Машинного обучения Azure для получения вывода как в реальном времени, так и в пакетном режиме в Экземплярах контейнеров Azure (ACI), Azure Kubernetes (AKS) и управляемых конечных точках.
Объекты модели MLFlow или определяемые пользователем функции Pandas, которые можно использовать в записных книжках Azure Synapse Analytics в потоковых или пакетных конвейерах.

Развертывание моделей в конечных точках Машинного обучения Azure

Вы можете использовать подключаемый модуль azureml-mlflow для развертывания модели в рабочей области Машинного обучения Azure. Подробную информацию о том, как развернуть модели MLflow в разных целевых объектах, смотрите на странице Развертывание моделей MLflow.

Внимание

Чтобы развернуть модели, их необходимо зарегистрировать в реестре Машинного обучения Azure. Развертывание незарегистрированных моделей в Машинном обучении Azure не поддерживается.

Развертывание моделей для пакетной оценки с помощью определяемых пользователем функций

Вы можете выбрать кластеры Azure Synapse Analytics для пакетной оценки. Модель MLflow загружается и используется в качестве пользовательской функции Spark Pandas для оценки новых данных.

from pyspark.sql.types import ArrayType, FloatType 

model_uri = "runs:/"+last_run_id+ {model_path} 

#Create a Spark UDF for the MLFlow model 
pyfunc_udf = mlflow.pyfunc.spark_udf(spark, model_uri) 

#Load Scoring Data into Spark Dataframe 
scoreDf = spark.table({table_name}).where({required_conditions}) 

#Make Prediction 
preds = (scoreDf 
           .withColumn('target_column_name', pyfunc_udf('Input_column1', 'Input_column2', ' Input_column3', …)) 
        ) 

display(preds)

Очистка ресурсов

Если вы хотите сохранить рабочую область Azure Synapse Analytics, но больше не требуется Машинное обучение Azure рабочей области, можно удалить рабочую область Машинное обучение Azure. Если вы не планируете использовать зарегистрированные метрики и артефакты в рабочей области, то вам нужно знать, что удалять такие ресурсы по отдельности в настоящее время нельзя. Вместо этого вам нужно удалить группу ресурсов, содержащую учетную запись хранения и рабочую область, и таким образом избежать ненужных расходов.

На портале Azure выберите Группы ресурсов в левой части окна.
В списке выберите созданную группу ресурсов.
Выберите команду Удалить группу ресурсов.
Введите имя группы ресурсов. Затем выберите Удалить.

Поделиться через