Развертывание моделей MLflow в пакетных развертываниях

Статья
04/07/2024

ОБЛАСТЬ ПРИМЕНЕНИЯ:Расширение машинного обучения Azure CLI версии 2 (current)Python SDK azure-ai-ml версии 2 (current)

В этой статье описано, как развернуть модели MLflow для Машинное обучение Azure для вывода пакета с помощью конечных точек пакетной службы. При развертывании моделей MLflow в пакетных конечных точках Машинное обучение Azure:

Предоставляет базовый образ MLflow или курированную среду, содержащую необходимые зависимости для запуска задания Машинное обучение Azure пакетной службы.
Создает конвейер пакетного задания с скриптом оценки, который можно использовать для обработки данных с помощью параллелизации.

Примечание.

Дополнительные сведения о поддерживаемых типах входных файлов и сведения о том, как работает модель MLflow, см . в рекомендациях при развертывании в пакетном выводе.

Сведения об этом примере

В этом примере показано, как развернуть модель MLflow в конечной точке пакетной службы для выполнения пакетных прогнозов. В этом примере используется модель MLflow на основе набора данных болезни сердца UCI. База данных содержит 76 атрибутов, но мы используем подмножество из 14 из них. Модель пытается предсказать наличие сердечно-сосудистых заболеваний у пациента. Целочисленное значение от 0 (нет присутствия) до 1 (присутствие).

Модель была обучена с помощью XGBBoost классификатора, и все необходимые предварительной обработки были упакованы в виде scikit-learn конвейера, что делает эту модель сквозным конвейером, который переходит от необработанных данных к прогнозам.

Пример в этой статье основан на примерах кода, содержащихся в репозитории azureml-examples . Чтобы выполнить команды локально без необходимости копирования и вставки YAML и других файлов, сначала клонируйте репозиторий, а затем измените каталоги в папку:

Azure CLI
Python

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/sdk/python

Файлы для этого примера находятся в следующих файлах:

cd endpoints/batch/deploy-models/heart-classifier-mlflow

Следуйте инструкциям в Jupyter Notebooks

Вы можете следовать этому примеру в следующих записных книжках. В клонированного репозитория откройте записную книжку: mlflow-for-batch-tabular.ipynb.

Необходимые компоненты

Перед выполнением действий, описанных в этой статье, убедитесь, что выполнены следующие необходимые условия:

Подписка Azure. Если у вас еще нет подписки Azure, создайте бесплатную учетную запись, прежде чем начинать работу. Попробуйте бесплатную или платную версию Машинного обучения Azure.
Рабочая область Машинного обучения Azure. Если у вас нет одного, выполните действия, описанные в статье "Управление Машинное обучение Azure рабочими областями", чтобы создать ее.
Убедитесь, что в рабочей области есть следующие разрешения:
- Создание конечных точек и развертываний пакетной службы или управление ими: используйте роль владельца, участника или настраиваемую роль, которая позволяет Microsoft.MachineLearningServices/workspaces/batchEndpoints/*.
- Создайте развертывания ARM в группе ресурсов рабочей области: используйте роль владельца, участника или настраиваемую роль, которая позволяет Microsoft.Resources/deployments/write в группе ресурсов, в которой развернута рабочая область.
Для работы с Машинное обучение Azure необходимо установить следующее программное обеспечение:
- Azure CLI
- Python
Azure CLI и ml расширение для Машинное обучение Azure.
```
az extension add -n ml
```
Примечание.

Развертывания компонентов конвейера для конечных точек пакетной службы появились в версии 2.7 ml расширения для Azure CLI. Используется az extension update --name ml для получения последней версии.
Пакет SDK Машинного обучения Azure для Python.
```
pip install azure-ai-ml
```
Примечание.

Классы ModelBatchDeployment и PipelineComponentBatchDeployment появились в пакете SDK версии 1.7.0. Используется pip install -U azure-ai-ml для получения последней версии.

Подключение к рабочей области

Рабочая область — это ресурс верхнего уровня для Машинного обучения Azure, который обеспечивает централизованное расположение для работы со всеми артефактами, созданными в Машинном обучении Azure. В этом разделе мы подключимся к рабочей области, в которой будем выполнять задачи развертывания.

Azure CLI
Python

Передайте значения для идентификатора подписки, рабочей области, расположения и группы ресурсов в следующем коде:

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

Импортируйте необходимые библиотеки:

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

Настройте сведения о рабочей области и получите дескриптор для рабочей области:

Передайте значения для идентификатора подписки, рабочей области и группы ресурсов в следующем коде:
```
subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
```

Шаги

Выполните следующие действия, чтобы развернуть модель MLflow в конечной точке пакетной службы для выполнения пакетного вывода над новыми данными:

Конечная точка пакетной службы может развертывать только зарегистрированные модели. В этом случае у нас уже есть локальная копия модели в репозитории, поэтому нам нужно опубликовать модель в реестре в рабочей области. Этот шаг можно пропустить, если модель, которую вы пытаетесь развернуть, уже зарегистрирована.
- Azure CLI
- Python
```
MODEL_NAME='heart-classifier-mlflow'
az ml model create --name $MODEL_NAME --type "mlflow_model" --path "model"
```
```
model_name = "heart-classifier-mlflow"
model_local_path = "model"

model = ml_client.models.create_or_update(
    Model(name=model_name, path=model_local_path, type=AssetTypes.MLFLOW_MODEL)
)
```
Прежде чем двигаться вперед, необходимо убедиться, что пакетные развертывания, которые мы собираемся создать, могут выполняться в некоторых инфраструктурах (вычислениях). Пакетные развертывания могут выполняться на любом Машинное обучение Azure вычислительных ресурсах, которые уже существуют в рабочей области. Это означает, что несколько пакетных развертываний могут совместно использовать одну и ту же инфраструктуру вычислений. В этом примере мы будем работать над Машинное обучение Azure вычислительным cpu-clusterкластером. Давайте убедимся, что вычислительные ресурсы существуют в рабочей области или создадим его в противном случае.
- Azure CLI
- Python
Создайте вычислительный кластер следующим образом:
```
az ml compute create -n batch-cluster --type amlcompute --min-instances 0 --max-instances 5
```
Чтобы создать новый вычислительный кластер, в котором необходимо создать развертывание, используйте следующий сценарий:
```
compute_name = "batch-cluster"
if not any(filter(lambda m: m.name == compute_name, ml_client.compute.list())):
    compute_cluster = AmlCompute(
        name=compute_name, description="amlcompute", min_instances=0, max_instances=5
    )
    ml_client.begin_create_or_update(compute_cluster).result()
```
Теперь пришло время создать конечную точку пакетной службы и развертывание. Начнем с конечной точки. Для конечных точек требуется только имя и описание. Имя конечной точки будет в конечном итоге в URI, связанном с вашей конечной точкой. Из-за этого имена конечных точек пакетной службы должны быть уникальными в пределах региона Azure. Например, в ней может быть только одна конечная точка пакетной службы с именем mybatchendpoint westus2.
- Azure CLI
- Python
В этом случае давайте поместим имя конечной точки в переменную, чтобы можно было легко ссылаться на нее позже.
```
ENDPOINT_NAME="heart-classifier"
```
В этом случае давайте поместим имя конечной точки в переменную, чтобы можно было легко ссылаться на нее позже.
```
endpoint_name = "heart-classifier"
```
Создание конечной точки:
- Azure CLI
- Python
Чтобы создать новую конечную точку YAML , создайте конфигурацию следующим образом:

endpoint.yml
```
$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: heart-classifier-batch
description: A heart condition classifier for batch inference
auth_mode: aad_token
```
Затем создайте конечную точку со следующей командой:
```
az ml batch-endpoint create -n $ENDPOINT_NAME -f endpoint.yml
```
Чтобы создать новую конечную точку, используйте следующий сценарий:
```
endpoint = BatchEndpoint(
    name=endpoint_name,
    description="A heart condition classifier for batch inference",
)
```
Затем создайте конечную точку со следующей командой:
```
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
Теперь давайте создадим развертывание. Модели MLflow не требуют указания среды или скрипта оценки при создании развертываний, созданных для вас. Однако их можно указать, если вы хотите настроить способ вывода развертывания.
- Azure CLI
- Python
Чтобы создать развертывание в созданной конечной точке, создайте YAML конфигурацию, как показано ниже. Вы можете проверить схему YAML полной пакетной конечной точки для получения дополнительных свойств.

deployment-simple/deployment.yml
```
$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: heart-classifier-batch
name: classifier-xgboost-mlflow
description: A heart condition classifier based on XGBoost
type: model
model: azureml:heart-classifier-mlflow@latest
compute: azureml:batch-cluster
resources:
  instance_count: 2
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 2
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info
```
Затем создайте развертывание с помощью следующей команды:
```
az ml batch-deployment create --file deployment-simple/deployment.yml --endpoint-name $ENDPOINT_NAME --set-default
```
Чтобы создать новое развертывание в созданной конечной точке, сначала определите развертывание:
```
deployment = ModelBatchDeployment(
    name="classifier-xgboost",
    description="A heart condition classifier based on XGBoost",
    endpoint_name=endpoint.name,
    model=model,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        instance_count=2,
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
        logging_level="info",
    ),
)
```
Затем создайте развертывание с помощью следующей команды:
```
ml_client.batch_deployments.begin_create_or_update(deployment).result()
```
Внимание

Настройте timeout в развертывании в зависимости от того, сколько времени требуется для выполнения вывода модели в одном пакете. Чем больше размер пакета, тем больше это значение должно быть. Remeber, mini_batch_size указывающий количество файлов в пакете, а не количество выборок. При работе с табличными данными каждый файл может содержать несколько строк, что увеличит время, необходимое для обработки каждого файла пакетной конечной точки. Используйте высокие значения в этих случаях, чтобы избежать ошибок времени ожидания.
Хотя вы можете вызвать определенное развертывание внутри конечной точки, обычно требуется вызвать саму конечную точку и разрешить конечной точке решить, какое развертывание следует использовать. Такое развертывание называется развертыванием по умолчанию. Это дает возможность изменять развертывание по умолчанию и, следовательно, изменять модель, обслуживающую развертывание, без изменения контракта с пользователем, вызывающим конечную точку. Чтобы обновить развертывание по умолчанию, используйте следующую инструкцию:
- Azure CLI
- Python
```
DEPLOYMENT_NAME="classifier-xgboost-mlflow"
az ml batch-endpoint update --name $ENDPOINT_NAME --set defaults.deployment_name=$DEPLOYMENT_NAME
```
```
endpoint = ml_client.batch_endpoints.get(endpoint.name)
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
На этом этапе наша конечная точка пакетной службы готова к использованию.

Тестирование развертывания

Для тестирования конечной точки мы будем использовать пример неназначенных данных, расположенных в этом репозитории, и их можно использовать с моделью. Конечные точки пакетной службы могут обрабатывать только данные, расположенные в облаке и доступные из рабочей области Машинное обучение Azure. В этом примере мы отправим его в хранилище данных Машинное обучение Azure. В частности, мы создадим ресурс данных, который можно использовать для вызова конечной точки для оценки. Однако обратите внимание, что пакетные конечные точки принимают данные, которые можно разместить в различных расположениях.

Сначала создадим ресурс данных. Этот ресурс данных состоит из папки с несколькими CSV-файлами, которые мы хотим обрабатывать параллельно с помощью конечных точек пакетной службы. Этот шаг можно пропустить, так как данные уже зарегистрированы в качестве ресурса данных или вы хотите использовать другой тип входных данных.
- Azure CLI
- Python
a. Создание определения ресурса данных в YAML:

heart-dataset-unlabeled.yml
```
$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: heart-dataset-unlabeled
description: An unlabeled dataset for heart classification.
type: uri_folder
path: data
```
b. Создайте ресурс данных:
```
az ml data create -f heart-dataset-unlabeled.yml
```
a. Создайте определение ресурса данных:
```
data_path = "data"
dataset_name = "heart-dataset-unlabeled"

heart_dataset_unlabeled = Data(
    path=data_path,
    type=AssetTypes.URI_FOLDER,
    description="An unlabeled dataset for heart classification",
    name=dataset_name,
)
```
b. Создайте ресурс данных:
```
ml_client.data.create_or_update(heart_dataset_unlabeled)
```
c. Обновите объект, чтобы отразить изменения:
```
heart_dataset_unlabeled = ml_client.data.get(name=dataset_name, label="latest")
```
Теперь, когда данные передаются и готовы к использованию, давайте вызовем конечную точку:
- Azure CLI
- Python
```
JOB_NAME = $(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input azureml:heart-dataset-unlabeled@latest --query name -o tsv)
```
Примечание.

jq Программа не может быть установлена во всех установках. Инструкции по установке можно получить по этой ссылке.
Совет

Какова разница между inputs input и при вызове конечной точки?

Как правило, можно использовать словарь inputs = {} с invoke методом для предоставления произвольного количества необходимых входных данных конечной точке пакетной службы, содержащей развертывание модели или развертывание конвейера.

Для развертывания модели можно использовать input в качестве более короткого способа указать расположение входных данных для развертывания, так как развертывание модели всегда принимает только один входные данные.
```
job = ml_client.batch_endpoints.invoke(endpoint_name=endpoint.name, input=input)
```
Совет

Обратите внимание, что мы не указываем имя развертывания в операции вызова. Это связано с тем, что конечная точка автоматически направляет задание в развертывание по умолчанию. Так как наша конечная точка имеет только одно развертывание, то это одно из них по умолчанию. Для конкретного развертывания можно указать аргумент или параметр deployment_name.
Пакетное задание запускается сразу после возврата команды. Вы можете отслеживать состояние задания, пока оно не завершится:
- Azure CLI
- Python
```
az ml job show -n $JOB_NAME --web
```
```
ml_client.jobs.get(job.name)
```

Анализ выходных данных

Выходные прогнозы создаются в predictions.csv файле, как указано в конфигурации развертывания. Задание создает именованные выходные данные, вызываемые score местом размещения этого файла. Для каждого пакетного задания создается только один файл.

Файл структурирован следующим образом:

На каждую точку данных, отправленную в модель, существует одна строка. Для табличных данных это означает, что файл (predictions.csv) содержит одну строку для каждой строки, присутствующих в каждом из обработанных файлов. Для других типов данных (например, изображений, аудио, текста) для каждого обработанного файла существует одна строка.
Следующие столбцы находятся в файле (в порядке):
- row (необязательно), соответствующий индекс строки в входном файле данных. Это применяется только в том случае, если входные данные являются табличными. Прогнозы возвращаются в том же порядке, что они отображаются в входном файле, чтобы вы могли полагаться на номер строки для сопоставления соответствующего прогноза.
- prediction, прогноз, связанный с входными данными. Это значение возвращается как есть, оно было предоставлено функцией модели predict(). .
- file_name— имя файла, из которого считывались данные. В табличных данных используйте это поле, чтобы узнать, какой прогноз принадлежит входным данным.

Результаты задания можно скачать с помощью имени задания:

Azure CLI
Python

Чтобы скачать прогнозы, используйте следующую команду:

az ml job download --name $JOB_NAME --output-name score --download-path ./

ml_client.jobs.download(name=scoring_job.name, download_path=".", output_name="score")

После скачивания файла его можно открыть с помощью избранного средства. В следующем примере прогнозы загружаются с помощью Pandas кадра данных.

import pandas as pd

score = pd.read_csv(
    "named-outputs/score/predictions.csv", names=["row", "prediction", "file"]
)

Выходные данные выглядят следующим образом:

строка	прогноз	файл
0	0	heart-unlabeled-0.csv
1	1	heart-unlabeled-0.csv
2	0	heart-unlabeled-0.csv
...	...	...
307	0	heart-unlabeled-3.csv

Совет

Обратите внимание, что в этом примере входные данные были табличными данными в CSV формате и были 4 различных входных файла (heart-unlabeled-0.csv, heart-unlabeled-1.csv, heart-unlabeled-2.csv и heart-unlabeled-3.csv).

Расширение файла	Тип, возвращаемый в качестве входных данных модели	Требование к подписи
`.csv`, , `.parquet.pqt`	`pd.DataFrame`	`ColSpec`. Если ничего не указано, типизация столбцов не применяется.
`.png`, , `.jpg.tiff.jpeg.bmp`,`.gif`	`np.ndarray`	`TensorSpec`. Входные данные изменены в соответствии с формой тензоров, если они доступны. Если подпись недоступна, выводятся тензоры типа `np.uint8`. Дополнительные рекомендации см. в статье "Рекомендации по обработке образов моделей MLflow".

Настройка развертываний моделей MLflow с помощью скрипта оценки

Модели MLflow можно развертывать в пакетных конечных точках без указания скрипта оценки в определении развертывания. Однако вы можете указать этот файл (обычно называемый драйвером пакетной службы), чтобы настроить способ выполнения вывода.

Обычно этот рабочий процесс выбирается при следующем:

Вам нужно обработать тип файла, не поддерживаемый развертываниями пакетной службы MLflow.
Необходимо настроить способ запуска модели, например, использовать конкретный вкус для его загрузки mlflow.<flavor>.load().
Вам необходимо выполнить предварительную обработку и обработку pos в подпрограмме оценки, если она не выполняется самой моделью.
Выходные данные модели не могут быть хорошо представлены в табличных данных. Например, это тензор, представляющий изображение.
Модель не может одновременно обрабатывать каждый файл из-за нехватки памяти, и он должен читать его в блоках.

Внимание

Если вы решили указать скрипт оценки для развертывания модели MLflow, вам также потребуется указать среду, в которой будет выполняться развертывание.

Шаги

Чтобы развернуть модель MLflow с помощью пользовательского скрипта оценки, выполните следующие действия.

Определите папку, в которой размещена модель MLflow.

a. Перейдите на портал Машинное обучение Azure.

b. Перейдите к разделу "Модели".

c. Выберите модель, которую вы пытаетесь развернуть, и щелкните вкладку "Артефакты".

d. Запишите отображаемую папку. Эта папка была указана при регистрации модели.

Создайте скрипт оценки. Обратите внимание, как имя папки model , которое вы определили до включения в функцию init() .

deployment-custom/code/batch_driver.py

# Copyright (c) Microsoft. All rights reserved.
# Licensed under the MIT license.

import os
import glob
import mlflow
import pandas as pd
import logging


def init():
    global model
    global model_input_types
    global model_output_names

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    # It is the path to the model folder
    # Please provide your model's folder name if there's one
    model_path = glob.glob(os.environ["AZUREML_MODEL_DIR"] + "/*/")[0]

    # Load the model, it's input types and output names
    model = mlflow.pyfunc.load(model_path)
    if model.metadata and model.metadata.signature:
        if model.metadata.signature.inputs:
            model_input_types = dict(
                zip(
                    model.metadata.signature.inputs.input_names(),
                    model.metadata.signature.inputs.pandas_types(),
                )
            )
        if model.metadata.signature.outputs:
            if model.metadata.signature.outputs.has_input_names():
                model_output_names = model.metadata.signature.outputs.input_names()
            elif len(model.metadata.signature.outputs.input_names()) == 1:
                model_output_names = ["prediction"]
    else:
        logging.warning(
            "Model doesn't contain a signature. Input data types won't be enforced."
        )


def run(mini_batch):
    print(f"run method start: {__file__}, run({len(mini_batch)} files)")

    data = pd.concat(
        map(
            lambda fp: pd.read_csv(fp).assign(filename=os.path.basename(fp)), mini_batch
        )
    )

    if model_input_types:
        data = data.astype(model_input_types)

    # Predict over the input data, minus the column filename which is not part of the model.
    pred = model.predict(data.drop("filename", axis=1))

    if pred is not pd.DataFrame:
        if not model_output_names:
            model_output_names = ["pred_col" + str(i) for i in range(pred.shape[1])]
        pred = pd.DataFrame(pred, columns=model_output_names)

    return pd.concat([data, pred], axis=1)

Создадим среду, в которой можно выполнить скрипт оценки. Так как наша модель является MLflow, требования conda также указаны в пакете модели (дополнительные сведения о моделях MLflow и файлах, включенных в него, см . в формате MLmodel). Затем мы создадим среду с помощью зависимостей conda из файла. Однако необходимо также включить пакетazureml-core, необходимый для пакетных развертываний.

Совет

Если модель уже зарегистрирована в реестре моделей, вы можете скачать или скопировать conda.yml файл, связанный с моделью, перейдя в раздел Студия машинного обучения Azure> Model > Select your model from the list > Artifacts. Откройте корневую папку в навигации и выберите указанный conda.yml файл. Щелкните "Скачать" или скопируйте его содержимое.

Внимание

В этом примере используется среда conda, указанная в /heart-classifier-mlflow/environment/conda.yaml. Этот файл был создан путем объединения исходного файла зависимостей conda MLflow и добавления пакета azureml-core. Файл из модели нельзя использовать conda.yml напрямую.
- Azure CLI
- Python
Определение среды будет включено в определение развертывания как анонимная среда. В развертывании вы увидите следующие строки:
```
environment:
  name: batch-mlflow-xgboost
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
Давайте получите ссылку на среду:
```
environment = Environment(
    name="batch-mlflow-xgboost",
    conda_file="environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```

Настройка развертывания:

Azure CLI
Python

Чтобы создать развертывание в созданной конечной точке, создайте YAML конфигурацию, как показано ниже. Вы можете проверить схему YAML полной пакетной конечной точки для получения дополнительных свойств.

deployment-custom/deployment.yml

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: heart-classifier-batch
name: classifier-xgboost-custom
description: A heart condition classifier based on XGBoost
type: model
model: azureml:heart-classifier-mlflow@latest
environment:
  name: batch-mlflow-xgboost
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
code_configuration:
  code: code
  scoring_script: batch_driver.py
compute: azureml:batch-cluster
resources:
  instance_count: 2
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 2
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info

deployment = ModelBatchDeployment(
    name="classifier-xgboost-custom",
    description="A heart condition classifier based on XGBoost with a custom scoring script",
    endpoint_name=endpoint.name,
    model=model,
    environment=environment,
    code_configuration=CodeConfiguration(code="code", scoring_script="batch_driver.py"),
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        instance_count=2,
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
        logging_level="info",
    ),
)

Теперь создадим развертывание:

Azure CLI
Python

az ml batch-deployment create --file deployment-custom/deployment.yml --endpoint-name $ENDPOINT_NAME

ml_client.batch_deployments.begin_create_or_update(deployment).result()

На этом этапе наша конечная точка пакетной службы готова к использованию.

Выполните следующий код, чтобы удалить пакетную конечную точку и все базовые развертывания. Задания оценки пакетной службы не будут удалены.

az ml batch-endpoint delete --name $ENDPOINT_NAME --yes

ml_client.batch_endpoints.begin_delete(endpoint_name).result()

Следующие шаги

Настройка выходных данных в пакетных развертываниях

Поделиться через

Развертывание моделей MLflow в пакетных развертываниях

Сведения об этом примере

Следуйте инструкциям в Jupyter Notebooks

Необходимые компоненты

Подключение к рабочей области

Шаги

Тестирование развертывания

Анализ выходных данных

Рекомендации при развертывании в пакетном выводе

Распределение работы для рабочих ролей

Поддержка типов файлов

Принудительное применение подписи для моделей MLflow

Поддержка вкуса

Настройка развертываний моделей MLflow с помощью скрипта оценки

Шаги

Очистка ресурсов

Следующие шаги

Обратная связь

Обратная связь

Дополнительные ресурсы