Bildverarbeitung mit Batchmodellimplementierungen

2024-09-03

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

Sie können Batchmodellimplementierungen für die Verarbeitung von Tabellendaten verwenden, aber auch für die Verarbeitung aller anderen Dateitypen wie Bilder. Diese Bereitstellungen werden sowohl in MLflow- als auch in benutzerdefinierten Modellen unterstützt. In diesem Artikel erfahren Sie, wie Sie ein Modell implementieren, das Bilder gemäß der ImageNet-Taxonomie klassifiziert.

Voraussetzungen

Ein Azure-Abonnement. Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.
Ein Azure Machine Learning-Arbeitsbereich. Informationen zum Erstellen eines Arbeitsbereichs finden Sie unter Verwalten von Azure Machine Learning-Arbeitsbereichen.
Die folgenden Berechtigungen im Azure Machine Learning-Arbeitsbereich:
- Zum Erstellen oder Verwalten von Batchendpunkten und Bereitstellungen: Verwenden Sie die Rolle „Besitzer“ oder „Mitwirkender“ oder eine benutzerdefinierte Rolle, der die Microsoft.MachineLearningServices/workspaces/batchEndpoints/*-Berechtigungen zugewiesen wurden.
- Zum Erstellen von Azure Resource Manager-Bereitstellungen in der Arbeitsbereichsressourcengruppe: Verwenden Sie die Rolle „Besitzer“ oder „Mitwirkender“ oder eine benutzerdefinierte Rolle, der die Microsoft.Resources/deployments/write-Berechtigung in der Ressourcengruppe zugewiesen wurde, in der der Arbeitsbereich bereitgestellt wird.
Azure Machine Learning-CLI oder Azure Machine Learning-SDK für Python:
- Azure-Befehlszeilenschnittstelle
- Python
Führen Sie den folgenden Befehl aus, um die Azure CLI und die ml-Erweiterung für Azure Machine Learning zu installieren:
```
az extension add -n ml
```
Bereitstellungen der Pipelinekomponenten für Batchendpunkte werden in Version 2.7 der ml-Erweiterung für die Azure CLI eingeführt. Verwenden Sie den az extension update --name ml-Befehl, um die aktuelle Version abzurufen.
Führen Sie den folgenden Befehl aus, um das Azure Machine Learning-SDK für Python zu installieren:
```
pip install azure-ai-ml
```
Die ModelBatchDeployment- und PipelineComponentBatchDeployment-Klassen werden in Version 1.7.0 des SDK eingeführt. Verwenden Sie den pip install -U azure-ai-ml-Befehl, um die aktuelle Version abzurufen.

Herstellen einer Verbindung mit Ihrem Arbeitsbereich

Der Arbeitsbereich ist die Ressource der obersten Ebene für Azure Machine Learning. Er bietet einen zentralen Ort für die Arbeit mit allen Artefakten, die Sie bei der Verwendung von Azure Machine Learning erstellen. In diesem Abschnitt stellen Sie eine Verbindung mit dem Arbeitsbereich her, in dem Sie Ihre Bereitstellungsaufgaben durchführen.

Azure-Befehlszeilenschnittstelle
Python

Geben Sie im folgenden Befehl Ihre Abonnement-ID, den Arbeitsbereichsnamen, den Ressourcengruppennamen und den Standort ein:

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

Importieren Sie die erforderlichen Bibliotheken.

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

Konfigurieren Sie die Arbeitsbereichsdetails, und rufen Sie einen Handle für den Arbeitsbereich ab:

Geben Sie im folgenden Befehl Ihre Abonnement-ID, den Namen der Ressourcengruppe und den Namen des Arbeitsbereichs ein:
```
subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
```

Informationen zu diesem Beispiel

In diesem Artikel wird ein Modell verwendet, das mit TensorFlow und der RestNet-Architektur erstellt wurde. Weitere Informationen finden Sie unter Identity Mappings in Deep Residual Networks. Sie können ein Beispiel für dieses Modell herunterladen. Für das Modell gelten folgende Einschränkungen:

Es funktioniert mit Bildern der Größe 244x244 (Tensoren von (224, 224, 3)).
Es erfordert, dass Eingaben auf den Bereich [0,1] skaliert werden.

Die Informationen in diesem Artikel basieren auf Codebeispielen, die im Repository azureml-examples enthalten sind. Klonen Sie das Repository, um die Befehle lokal auszuführen, ohne YAML- und andere Dateien kopieren/einfügen zu müssen. Ändern Sie Verzeichnisse in cli/endpoints/batch/deploy-models/imagenet-classifier, wenn Sie die Azure CLI oder sdk/python/endpoints/batch/deploy-models/imagenet-classifier verwenden, wenn Sie das SDK für Python verwenden.

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli/endpoints/batch/deploy-models/imagenet-classifier

Folgen in Jupyter Notebooks

Sie können diesem Beispiel in einem Jupyter Notebook folgen. Öffnen Sie in dem geklonten Repository das folgende Notebook: imagenet-classifier-batch.ipynb.

Bildklassifizierung mit Batchbereitstellungen

In diesem Beispiel erfahren Sie, wie Sie ein Deep Learning-Modell implementieren, das ein bestimmtes Bild gemäß der Taxonomie von ImageNet klassifizieren kann.

Erstellen des Endpunkts

Erstellen Sie den Endpunkt, der das Modell hostet:

Azure-Befehlszeilenschnittstelle
Python

Geben Sie den Namen des Endpunkts an.

ENDPOINT_NAME="imagenet-classifier-batch"

Erstellen Sie die folgende YAML-Datei, um den Batchendpunkt namens endpoint.yml zu definieren:

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: imagenet-classifier-batch
description: A batch endpoint for performing image classification using a TFHub model ImageNet model.
auth_mode: aad_token

Um den Endpunkt zu erstellen, führen Sie den folgenden Code aus:

az ml batch-endpoint create --file endpoint.yml  --name $ENDPOINT_NAME

Geben Sie den Namen des Endpunkts an.

endpoint_name="imagenet-classifier-batch"

Konfigurieren Sie den Endpunkt.

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="An batch service to perform ImageNet image classification",
)

Um den Endpunkt zu erstellen, führen Sie den folgenden Code aus:
```
ml_client.batch_endpoints.begin_create_or_update(endpoint)
```

Registrieren des Modells

Modellimplementierungen können nur registrierte Modelle bereitstellen. Sie müssen das Modell registrieren. Sie können diesen Schritt überspringen, wenn das Modell, das Sie bereitstellen möchten, bereits registriert ist.

Laden Sie eine Kopie des Modells herunter.

Azure-Befehlszeilenschnittstelle
Python

wget https://azuremlexampledata.blob.core.windows.net/data/imagenet/model.zip
unzip model.zip -d .

import os
import urllib.request
from zipfile import ZipFile

response = urllib.request.urlretrieve('https://azuremlexampledata.blob.core.windows.net/data/imagenet/model.zip', 'model.zip')

os.mkdirs("imagenet-classifier", exits_ok=True)
with ZipFile(response[0], 'r') as zip:
  model_path = zip.extractall(path="imagenet-classifier")

Registrieren des Modells.

Azure-Befehlszeilenschnittstelle
Python

MODEL_NAME='imagenet-classifier'
az ml model create --name $MODEL_NAME --path "model"

model_name = 'imagenet-classifier'
model = ml_client.models.create_or_update(
    Model(name=model_name, path=model_path, type=AssetTypes.CUSTOM_MODEL)
)

Erstellen Sie ein Bewertungsskript.

Erstellen Sie ein Bewertungsskript, das die von der Batchbereitstellung bereitgestellten Bilder lesen und die Bewertungen des Modells zurückgeben kann.

Die init-Methode lädt das Modell mithilfe des keras-Moduls in tensorflow.
Die run-Methode wird für jeden Minibatch ausgeführt, den die Batchbereitstellung bereitstellt.
Die run-Methode liest jeweils ein Bild der Datei.
Die run-Methode ändert die Größe der Bilder in die erwarteten Größen für das Modell.
Die run-Methode führt für die Bilder eine Neuskalierung in die Bereichsdomäne [0,1] durch, die vom Modell erwartet wird.
Das Skript gibt die Klassen und die Wahrscheinlichkeiten im Zusammenhang mit den Vorhersagen zurück.

Dieser Code ist die Datei code/score-by-file/batch_driver.py:

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from os.path import basename
from PIL import Image
from tensorflow.keras.models import load_model


def init():
    global model
    global input_width
    global input_height

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)
    input_width = 244
    input_height = 244


def run(mini_batch):
    results = []

    for image in mini_batch:
        data = Image.open(image).resize(
            (input_width, input_height)
        )  # Read and resize the image
        data = np.array(data) / 255.0  # Normalize
        data_batch = tf.expand_dims(
            data, axis=0
        )  # create a batch of size (1, 244, 244, 3)

        # perform inference
        pred = model.predict(data_batch)

        # Compute probabilities, classes and labels
        pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
        pred_class = tf.math.argmax(pred, axis=-1).numpy()

        results.append([basename(image), pred_class[0], pred_prob])

    return pd.DataFrame(results)

Tipp

Obwohl Bilder von der Bereitstellung in Minibatches bereitgestellt werden, verarbeitet dieses Bewertungsskript jeweils ein Bild. Dies ist ein gängiges Muster, weil es bei dem Versuch, den gesamten Batch zu laden und zugleich an das Modell zu senden, zu einer hohen Arbeitsspeicherauslastung auf dem Batch-Executor kommen kann (OOM-Ausnahmen).

Es gibt bestimmte Fälle, in denen dies einen hohen Durchsatz in der Bewertungsaufgabe ermöglicht. Dies ist der Fall bei Batchbereitstellungen über eine GPU-Hardware, bei denen Sie eine hohe GPU-Auslastung erreichen möchten. Ein Bewertungsskript, das diesen Ansatz nutzt, finden Sie unter Bereitstellungen mit hohem Durchsatz.

Hinweis

Wenn Sie ein generatives Modell implementieren möchten, das Dateien generiert, lernen Sie, wie Sie ein Bewertungsskript erstellen: Anpassen von Ausgaben in Batchbereitstellungen.

Erstellen der Bereitstellung

Nachdem Sie das Bewertungsskript erstellt haben, erstellen Sie eine Batchbereitstellung dafür. Gehen Sie dazu wie folgt vor:

Stellen Sie sicher, dass Sie einen Computecluster erstellt haben, in dem Sie die Bereitstellung erstellen können. Verwenden Sie in diesem Beispiel einen Computecluster namens gpu-cluster. Obwohl nicht erforderlich, beschleunigt die Verwendung von GPUs die Verarbeitung.
Geben Sie an, in welcher Umgebung die Bereitstellung ausgeführt werden soll. In diesem Beispiel wird das Modell in TensorFlow ausgeführt. Azure Machine Learning verfügt bereits über eine Umgebung, in der die erforderliche Software installiert ist. Somit können Sie diese Umgebung wiederverwenden. Sie müssen eine Reihe von Abhängigkeiten in einer Datei namens conda.yml hinzufügen.
- Azure-Befehlszeilenschnittstelle
- Python
Die Umgebungsdefinition wird in die Bereitstellungsdatei aufgenommen.
```
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
```
Rufen Sie einen Verweis auf die Umgebung ab:
```
environment = Environment(
    name="tensorflow27-cuda11-gpu",
    conda_file="environment/conda.yml",
    image="mcr.microsoft.com/azureml/curated/tensorflow-2.7-ubuntu20.04-py38-cuda11-gpu:latest",
)
```

Erstellen Sie die Bereitstellung.

Azure-Befehlszeilenschnittstelle
Python

Um eine neue Bereitstellung unter dem erstellten Endpunkt zu erstellen, erstellen Sie eine YAML-Konfiguration wie im folgenden Beispiel. Weitere Eigenschaften finden Sie im vollständigen YAML-Schema des Batchendpunkts.

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: imagenet-classifier-batch
name: imagenet-classifier-resnetv2
description: A ResNetV2 model architecture for performing ImageNet classification in batch
type: model
model: azureml:imagenet-classifier@latest
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
  conda_file: environment/conda.yaml
code_configuration:
  code: code/score-by-file
  scoring_script: batch_driver.py
resources:
  instance_count: 2
settings:
  max_concurrency_per_instance: 1
  mini_batch_size: 5
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info

Erstellen Sie die Bereitstellung mit dem folgenden Befehl:

az ml batch-deployment create --file deployment-by-file.yml --endpoint-name $ENDPOINT_NAME --set-default

Um eine neue Bereitstellung mit der angegebenen Umgebung und dem angegebenen Bewertungsskript zu erstellen, verwenden Sie den folgenden Code:

deployment = BatchDeployment(
    name="imagenet-classifier-resnetv2",
    description="A ResNetV2 model architecture for performing ImageNet classification in batch",
    endpoint_name=endpoint.name,
    model=model,
    environment=environment,
    code_configuration=CodeConfiguration(
        code="code/score-by-file",
        scoring_script="batch_driver.py",
    ),
    compute=compute_name,
    instance_count=2,
    max_concurrency_per_instance=1,
    mini_batch_size=10,
    output_action=BatchDeploymentOutputAction.APPEND_ROW,
    output_file_name="predictions.csv",
    retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
    logging_level="info",
)

Erstellen Sie die Bereitstellung mit dem folgenden Befehl:

ml_client.batch_deployments.begin_create_or_update(deployment)

Sie können zwar eine bestimmte Bereitstellung innerhalb eines Endpunkts aufrufen, in der Regel rufen Sie jedoch den Endpunkt selbst auf und überlassen diesem die Entscheidung, welche Bereitstellung verwendet werden soll. Eine derartige Bereitstellung wird als Standard-Bereitstellung bezeichnet.

Mithilfe dieses Ansatzes können Sie die Standardbereitstellung und das Modell für die Bereitstellung ändern, ohne Ihren Vertrag mit dem Benutzer, der den Endpunkt aufruft, ändern zu müssen. Verwenden Sie den folgenden Code, um die Standardbereitstellung zu ändern:
- Azure Machine Learning-CLI
- Azure Machine Learning SDK für Python
```
az ml batch-endpoint update --name $ENDPOINT_NAME --set defaults.deployment_name=$DEPLOYMENT_NAME
```
```
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint)
```

Ihr Batchendpunkt kann verwendet werden.

Testen der Bereitstellung

Verwenden Sie zum Testen des Endpunkts eine Stichprobe von 1.000 Bildern aus dem ursprünglichen ImageNet-Dataset. Batchendpunkte können nur Daten verarbeiten, die sich in der Cloud befinden und über den Azure Machine Learning-Arbeitsbereich zugänglich sind. Laden Sie ihn in einen Azure Machine Learning-Datenspeicher hoch. Erstellen Sie eine Datenressource, die zum Aufrufen des Endpunkts für die Bewertung verwendet werden kann.

Hinweis

Batchendpunkte akzeptieren Daten, die an mehreren Speicherorttypen platziert werden können.

Laden Sie die zugehörigen Beispieldaten herunter:

Azure-Befehlszeilenschnittstelle
Python

wget https://azuremlexampledata.blob.core.windows.net/data/imagenet/imagenet-1000.zip
unzip imagenet-1000.zip -d data

Hinweis

Wenn Sie wget nicht lokal installiert haben, installieren Sie es, oder verwenden Sie einen Browser, um die ZIP-Datei abzurufen.

!wget https://azuremlexampledata.blob.core.windows.net/data/imagenet-1000.zip
!unzip imagenet-1000.zip -d data

Erstellen Sie das Datenobjekt aus den heruntergeladenen Daten.

Azure-Befehlszeilenschnittstelle
Python

Erstellen Sie eine Datenobjektdefinition in einer YAML-Datei namens imagenet-sample-unlabeled.yml:

$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: imagenet-sample-unlabeled
description: A sample of 1000 images from the original ImageNet dataset. Download content from https://azuremlexampledata.blob.core.windows.net/data/imagenet-1000.zip.
type: uri_folder
path: data

Erstellen Sie dann das Datenobjekt.

az ml data create -f imagenet-sample-unlabeled.yml

Geben Sie folgende Werte an:

data_path = "data"
dataset_name = "imagenet-sample-unlabeled"

imagenet_sample = Data(
    path=data_path,
    type=AssetTypes.URI_FOLDER,
    description="A sample of 1000 images from the original ImageNet dataset",
    name=dataset_name,
)

Erstellen Sie dann das Datenobjekt.

ml_client.data.create_or_update(imagenet_sample)

Verwenden Sie diesen Code, um das neu erstellte Datenobjekt abzurufen:

imagenet_sample = ml_client.data.get(dataset_name, label="latest")

Wenn die Daten hochgeladen worden und für die Verwendung bereit sind, rufen Sie den Endpunkt auf:
- Azure-Befehlszeilenschnittstelle
- Python
```
JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input azureml:imagenet-sample-unlabeled@latest --query name -o tsv)
```
Hinweis

Wenn das Hilfsprogramm jq nicht installiert ist, lesen Sie Herunterladen von jq.
Tipp

Was ist der Unterschied zwischen dem inputs- und dem input-Parameter, wenn Sie einen Endpunkt aufrufen?

Im Allgemeinen können Sie einen inputs = {}-Parameter im Wörterbuch mit der invoke-Methode verwenden, um eine beliebige Anzahl erforderlicher Eingaben für einen Batchendpunkt bereitzustellen, der eine Modellimplementierung oder eine Pipelinebereitstellung enthält.

Bei einer Modellimplementierung können Sie den input-Parameter als schnellere Möglichkeit verwenden, um den Eingabedatenspeicherort für die Bereitstellung anzugeben. Dieser Ansatz funktioniert, da eine Modellimplementierung immer nur eine Dateneingabeentgegennimmt.
```
input = Input(type=AssetTypes.URI_FOLDER, path=imagenet_sample.id)
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input,
)
```

Tipp

Sie geben den Bereitstellungsnamen nicht im Aufrufvorgang an. Dies liegt daran, dass der Endpunkt den Auftrag automatisch an die Standardbereitstellung weiterleitet. Da der Endpunkt nur über eine Bereitstellung verfügt, ist dies der Standardwert. Sie können eine bestimmte Bereitstellung als Ziel angeben, indem Sie das Argument/den Parameter deployment_nameangeben.

Sobald der Befehl zurückgegeben wird, wird ein Batchauftrag gestartet. Sie können den Status des Auftrags überwachen, bis er abgeschlossen ist.
- Azure-Befehlszeilenschnittstelle
- Python
```
az ml job show -n $JOB_NAME --web
```
```
ml_client.jobs.get(job.name)
```
Nachdem die Bereitstellung abgeschlossen ist, laden Sie die Vorhersagen herunter.
- Azure-Befehlszeilenschnittstelle
- Python
Verwenden Sie den folgenden Befehl, um die Vorhersagen herunterzuladen:
```
az ml job download --name $JOB_NAME --output-name score --download-path ./
```
```
ml_client.jobs.download(name=job.name, output_name='score', download_path='./')
```

Die Vorhersagen sehen wie die folgende Ausgabe aus. Die Vorhersagen werden zur Erleichterung des Lesers mit Bezeichnungen kombiniert. Weitere Informationen dazu, wie Sie diesen Effekt erreichen, finden Sie im zugehörigen Notebook.

import pandas as pd
score = pd.read_csv("named-outputs/score/predictions.csv", header=None,  names=['file', 'class', 'probabilities'], sep=' ')
score['label'] = score['class'].apply(lambda pred: imagenet_labels[pred])
score

datei	class	Wahrscheinlichkeiten	Etikett
n02088094_Afghan_hound.JPEG	161	0.994745	Afghan hound
n02088238_basset	162	0.999397	basset
n02088364_beagle. JPEG	165	0.366914	bluetick
n02088466_bloodhound. JPEG	164	0.926464	Bluthund
...	...	...	...

Bereitstellungen mit hohem Durchsatz

Wie bereits erwähnt, verarbeitet die Bereitstellung nur jeweils ein Bild, auch wenn die Batchbereitstellung einen Batch von Bildern bereitstellt. In den meisten Fällen ist dieser Ansatz der beste. Er vereinfacht die Ausführung der Modelle und vermeidet mögliche Probleme aufgrund unzureichenden Speichers. In bestimmten anderen Fällen kann es jedoch sinnvoll sein, die zugrunde liegende Hardware so weit wie möglich auszulasten. Dies ist z. B. bei GPUs der Fall.

In diesen Fällen ist es sinnvoll, Rückschlüsse auf den gesamten Batch von Daten zu ziehen. Dieser Ansatz bedeutet, dass der gesamte Satz von Bildern in den Arbeitsspeicher geladen und direkt an das Modell gesendet wird. Im folgenden Beispiel wird TensorFlow verwendet, um den Batch von Bildern gleichzeitig zu lesen und zu bewerten. Für die Vorverarbeitung von Daten werden auch TensorFlow-Vorgänge verwendet. Die gesamte Pipeline wird auf demselben verwendeten Gerät (CPU/GPU) verarbeitet.

Warnung

Einige Modelle haben eine nicht lineare Beziehung zur Größe der Eingaben in Bezug auf den Speicherverbrauch. Um Ausnahmen wegen ungenügenden Arbeitsspeichers zu vermeiden, erstellen Sie den Batch erneut (wie in diesem Beispiel), oder verringern Sie die Größe der von der Batchbereitstellung erstellten Batches.

Erstellen Sie das Bewertungsskript code/score-by-batch/batch_driver.py:

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow.keras.models import load_model


def init():
    global model
    global input_width
    global input_height

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)
    input_width = 244
    input_height = 244


def decode_img(file_path):
    file = tf.io.read_file(file_path)
    img = tf.io.decode_jpeg(file, channels=3)
    img = tf.image.resize(img, [input_width, input_height])
    return img / 255.0


def run(mini_batch):
    images_ds = tf.data.Dataset.from_tensor_slices(mini_batch)
    images_ds = images_ds.map(decode_img).batch(64)

    # perform inference
    pred = model.predict(images_ds)

    # Compute probabilities, classes and labels
    pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
    pred_class = tf.math.argmax(pred, axis=-1).numpy()

    return pd.DataFrame(
        [mini_batch, pred_prob, pred_class], columns=["file", "probability", "class"]
    )

Dieses Skript erstellt ein Tensor-Dataset aus dem Minibatch, der von der Batchbereitstellung gesendet wird. Dieses Dataset wird vorverarbeitet, um die erwarteten Tensoren für das Modell abzurufen, indem der map-Vorgang mit der Funktion decode_img verwendet wird.
Das Dataset wird erneut als Batch (16) zusammengefasst, um die Daten an das Modell zu senden. Verwenden Sie diesen Parameter, um zu steuern, wie viele Informationen Sie gleichzeitig in den Arbeitsspeicher laden und an das Modell senden können. Wenn die Ausführung auf einer GPU erfolgt, müssen Sie diesen Parameter sorgfältig optimieren, um die maximale Auslastung des Grafikprozessors zu erreichen, bevor eine OOM-Ausnahme auftritt.
Nachdem die Vorhersagen berechnet worden sind, werden die Tensoren in numpy.ndarray konvertiert.

Erstellen Sie die Bereitstellung.

Azure-Befehlszeilenschnittstelle
Python

Um eine neue Bereitstellung unter dem erstellten Endpunkt zu erstellen, erstellen Sie eine YAML-Konfiguration wie im folgenden Beispiel. Weitere Eigenschaften finden Sie im vollständigen YAML-Schema des Batchendpunkts.

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: imagenet-classifier-batch
name: imagenet-classifier-resnetv2
description: A ResNetV2 model architecture for performing ImageNet classification in batch
type: model
model: azureml:imagenet-classifier@latest
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
  conda_file: environment/conda.yaml
code_configuration:
  code: code/score-by-batch
  scoring_script: batch_driver.py
resources:
  instance_count: 2
tags:
  device_acceleration: CUDA
  device_batching: 16
settings:
  max_concurrency_per_instance: 1
  mini_batch_size: 5
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info

Erstellen Sie die Bereitstellung mit dem folgenden Befehl:

az ml batch-deployment create --file deployment-by-batch.yml --endpoint-name $ENDPOINT_NAME --set-default

Um eine neue Bereitstellung mit der angegebenen Umgebung und dem angegebenen Bewertungsskript zu erstellen, verwenden Sie den folgenden Code:

deployment = BatchDeployment(
    name="imagenet-classifier-resnetv2",
    description="A ResNetV2 model architecture for performing ImageNet classification in batch",
    endpoint_name=endpoint.name,
    model=model,
    environment=environment,
    code_configuration=CodeConfiguration(
        code="code/score-by-batch",
        scoring_script="batch_driver.py",
    ),
    compute=compute_name,
    instance_count=2,
    tags={ "device_acceleration": "CUDA", "device_batching": "16" }
    max_concurrency_per_instance=1,
    mini_batch_size=10,
    output_action=BatchDeploymentOutputAction.APPEND_ROW,
    output_file_name="predictions.csv",
    retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
    logging_level="info",
)

Erstellen Sie die Bereitstellung mit dem folgenden Befehl:

ml_client.batch_deployments.begin_create_or_update(deployment)

Sie können diese neue Bereitstellung mit den zuvor gezeigten Beispieldaten verwenden. Denken Sie daran, dass Sie zum Aufrufen dieser Bereitstellung entweder den Namen der Bereitstellung in der Aufrufmethode angeben oder ihn als Standardnamen festlegen müssen.

Überlegungen zu MLflow-Modellen, die Bilder verarbeiten

MLflow-Modelle in Batchendpunkten unterstützen das Lesen von Bildern als Eingabedaten. Da MLflow-Bereitstellungen kein Bewertungsskript erfordern, sollten Sie die folgenden Überlegungen berücksichtigen, wenn Sie sie verwenden:

Unterstützte Bilddateien sind: .png, .jpg, .jpeg, .tiff, .bmp und .gif.
MLflow-Modelle sollten erwarten, dass sie ein np.ndarray als Eingabe erhalten, das den Dimensionen des Eingabebilds entspricht. Damit mehrere Bildgrößen in jedem Batch unterstützt werden, ruft der Batch Executor das MLflow-Modell einmal pro Bilddatei auf.
Es wird dringend empfohlen, dass MLflow-Modelle eine Signatur einschließen. Wenn sie dies tun, muss sie vom Typ TensorSpec sein. Eingaben werden umgeformt, um der Form des Tensors zu entsprechen, falls verfügbar. Wenn keine Signatur verfügbar ist, erfolgt für Tensoren des Typs np.uint8 das Rückschließen.
Modelle, die eine Signatur enthalten und von denen erwartet wird, dass sie variable Bildgrößen verarbeiten können, sollten eine Signatur einschließen, die dies garantieren kann. Die folgende Signatur lässt beispielsweise Batches von Bildern mit 3 Kanälen zu.

import numpy as np
import mlflow
from mlflow.models.signature import ModelSignature
from mlflow.types.schema import Schema, TensorSpec

input_schema = Schema([
  TensorSpec(np.dtype(np.uint8), (-1, -1, -1, 3)),
])
signature = ModelSignature(inputs=input_schema)

(...)

mlflow.<flavor>.log_model(..., signature=signature)

Ein funktionierendes Beispiel finden Sie im Jupyter Notebook imagenet-classifier-mlflow.ipynb. Weitere Informationen zur Verwendung von MLflow-Modellen in Batchbereitstellungen finden Sie unter Verwenden von MLflow-Modellen in Batchbereitstellungen.

Freigeben über

Bildverarbeitung mit Batchmodellimplementierungen

Voraussetzungen

Herstellen einer Verbindung mit Ihrem Arbeitsbereich

Informationen zu diesem Beispiel

Folgen in Jupyter Notebooks

Bildklassifizierung mit Batchbereitstellungen

Erstellen des Endpunkts

Registrieren des Modells

Erstellen Sie ein Bewertungsskript.

Erstellen der Bereitstellung

Testen der Bereitstellung

Bereitstellungen mit hohem Durchsatz

Überlegungen zu MLflow-Modellen, die Bilder verarbeiten

Nächste Schritte

Feedback

Zusätzliche Ressourcen