バッチモデルデプロイを使用した画像処理

適用対象:Azure CLI ml 拡張機能 v2 (現行)Python SDK azure-ai-ml v2 (現行)

バッチモデルデプロイは、表形式データの処理だけでなく、画像などのその他のファイルの種類に対しても使用できます。これらのデプロイは、MLflow とカスタムの両モデルでサポートされています。この記事では、ImageNet 分類に従って画像を分類するモデルをデプロイする方法を学習します。

前提条件

Azure サブスクリプション。 Azure サブスクリプションをお持ちでない場合は、開始する前に無料アカウントを作成してください。
Azure Machine Learning ワークスペース。ワークスペースの作成については、Azure Machine Learning ワークスペースの管理に関する記事をご覧ください。
Azure Machine Learning ワークスペースでの次のアクセス許可:
- バッチエンドポイントとデプロイを作成または管理する場合: 所有者、共同作成者、または Microsoft.MachineLearningServices/workspaces/batchEndpoints/* アクセス許可が割り当てられているカスタムロールを使います。
- ワークスペースリソースグループに Azure Resource Manager のデプロイを作成する場合: 所有者、共同作成者、またはワークスペースがデプロイされるリソースグループでの Microsoft.Resources/deployments/write アクセス許可が割り当てられているカスタムロールを使います。
Azure Machine Learning CLI または Azure Machine Learning SDK for Python:
- Azure CLI
- Python
次のコマンドを実行して、Azure CLI と ml という Azure Machine Learning 用の拡張機能をインストールします。
```
az extension add -n ml
```
バッチエンドポイントのパイプラインコンポーネントのデプロイは、Azure CLI 用 ml 拡張機能のバージョン 2.7 で導入されています。 az extension update --name ml コマンドを使用して、最新バージョンを取得します。
次のコマンドを実行して、Azure Machine Learning SDK for Python をインストールします。
```
pip install azure-ai-ml
```
ModelBatchDeployment と PipelineComponentBatchDeployment クラスは、SDK のバージョン 1.7.0 で導入されています。 pip install -U azure-ai-ml コマンドを使用して、最新バージョンを取得します。

ワークスペースに接続する

ワークスペースは、Azure Machine Learning の最上位のリソースです。これは、Azure Machine Learning を使用するときに作成するすべての成果物を操作するための一元的な場所を提供します。このセクションでは、デプロイタスクを実行するワークスペースに接続します。

Azure CLI
Python

次のコマンドで、自分のサブスクリプション ID、ワークスペース名、リソースグループ名、場所を入力します。

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

必要なライブラリをインポートします。

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

ワークスペースの詳細を構成し、ワークスペースへのハンドルを取得します。

次のコマンドで、自分のサブスクリプション ID、リソースグループ名、ワークスペース名を入力します。
```
subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
```

このサンプルについて

この記事では、TensorFlow と RestNet アーキテクチャを使用して構築されたモデルを使用します。詳細については、「深い残差ネットワークでの ID マッピング」を参照してください。 https://azuremlexampledata.blob.core.windows.net/data/imagenet/model.zipをダウンロードできます。このモデルには以下の制約があります。

サイズ 244x244 ((224, 224, 3) のテンソル) の画像で動作します。
入力を範囲 [0,1] にスケーリングする必要があります。

この記事の情報は、azureml-examples リポジトリに含まれているコードサンプルを基にしています。 YAML や他のファイルをコピー/貼り付けすることなくコマンドをローカルで実行するには、リポジトリをクローンします。 Azure CLI を使用している場合は cli/endpoints/batch/deploy-models/imagenet-classifier に、Python 用の SDK を使用している場合は sdk/python/endpoints/batch/deploy-models/imagenet-classifier にディレクトリを変更します。

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli/endpoints/batch/deploy-models/imagenet-classifier

Jupyter ノートブックで経過をたどる

Jupyter Notebook で、このサンプルに従って実行できます。複製されたリポジトリで、ノートブック imagenet-classifier-batch.ipynb を開きます。

バッチデプロイを使用した画像の分類

この例では、ImageNet の分類に従って与えられた画像を分類できるディープラーニングモデルをデプロイする方法を学習します。

エンドポイントを作成する

以下のようにしてモデルをホストするエンドポイントを作成します。

Azure CLI
Python

エンドポイントの名前を指定します。
```
ENDPOINT_NAME="imagenet-classifier-batch"
```

以下のバッチエンドポイントを定義する YAML ファイルを endpoint.yml という名前で作成します。

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: imagenet-classifier-batch
description: A batch endpoint for performing image classification using a TFHub model ImageNet model.
auth_mode: aad_token

エンドポイントを作成するために、以下のコードを実行します。

az ml batch-endpoint create --file endpoint.yml  --name $ENDPOINT_NAME

エンドポイントの名前を指定します。
```
endpoint_name="imagenet-classifier-batch"
```

エンドポイントを構成します。

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="An batch service to perform ImageNet image classification",
)

エンドポイントを作成するために、以下のコードを実行します。
```
ml_client.batch_endpoints.begin_create_or_update(endpoint)
```

モデルを登録する

モデルデプロイでデプロイできるのは登録済みのモデルだけです。モデルを登録する必要があります。デプロイ対象のモデルが既に登録されている場合は、この手順をスキップできます。

モデルのコピーをダウンロードします。

Azure CLI
Python

wget "${IMAGENET_SAMPLE_URI_BASE}/model.zip"
unzip model.zip -d .

import os
import urllib.request
from zipfile import ZipFile

response = urllib.request.urlretrieve('https://azuremlexampledata.blob.core.windows.net/data/imagenet/model.zip', 'model.zip')

os.mkdirs("imagenet-classifier", exits_ok=True)
with ZipFile(response[0], 'r') as zip:
  model_path = zip.extractall(path="imagenet-classifier")

モデルを登録します。

Azure CLI
Python

MODEL_NAME='imagenet-classifier'
az ml model create --name $MODEL_NAME --path "model"

model_name = 'imagenet-classifier'
model = ml_client.models.create_or_update(
    Model(name=model_name, path=model_path, type=AssetTypes.CUSTOM_MODEL)
)

スコアリングスクリプトを作成する

バッチデプロイによって指定された画像を読み取り、モデルのスコアを返すことができるスコアリングスクリプトを作成します。

init メソッドが keras の tensorflow モジュールを使用してモデルを読み込みます。
run メソッドがバッチデプロイが提供するミニバッチごとに実行されます。
run メソッドが一度に 1 つのファイルの画像を読み取ります。
run メソッドがモデルの予想されるサイズに画像のサイズを変更します。
run メソッドが、モデルが期待する範囲 [0,1] のドメインに画像を再スケーリングする。
スクリプトがクラスとその予測に関する確率を返します。

次に示すコードは code/score-by-file/batch_driver.py ファイルです。

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from os.path import basename
from PIL import Image
from tensorflow.keras.models import load_model


def init():
    global model
    global input_width
    global input_height

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)
    input_width = 244
    input_height = 244


def run(mini_batch):
    results = []

    for image in mini_batch:
        data = Image.open(image).resize(
            (input_width, input_height)
        )  # Read and resize the image
        data = np.array(data) / 255.0  # Normalize
        data_batch = tf.expand_dims(
            data, axis=0
        )  # create a batch of size (1, 244, 244, 3)

        # perform inference
        pred = model.predict(data_batch)

        # Compute probabilities, classes and labels
        pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
        pred_class = tf.math.argmax(pred, axis=-1).numpy()

        results.append([basename(image), pred_class[0], pred_prob])

    return pd.DataFrame(results)

ヒント

画像はデプロイによってミニバッチで提供されますが、このスコアリングスクリプトは一度に 1 つの画像を処理します。一度にバッチ全体を読み込んでそれをモデルに送信しようとすると、バッチ Executor 上で高メモリ負荷 (OOM 例外) が発生する可能性があるため、これが一般的なパターンとして使用されます。

これを行うことでスコアリングタスクでの高いスループットを実現できるケースもあります。高い GPU 使用率を実現したい GPU ハードウェアを介したバッチデプロイはそのようなケースの 1 つです。このアプローチを利用するスコアリングスクリプトについては、「高スループットデプロイ」を参照してください。

注

ファイルを生成する生成モデルをデプロイしたい場合は、「バッチデプロイでの出力のカスタマイズ」でスコアリングスクリプトを作成する方法を学習してください。

配置を作成する

スコアリングスクリプトを作成したら、それ用のバッチデプロイを作成します。次の手順に従います。

デプロイを作成できるコンピューティングクラスターが作成済みであることを確認します。この例では、gpu-cluster という名前のコンピューティングクラスターを使用します。必須ではありませんが、GPU を使用すると処理が高速になります。
どの環境でデプロイを実行するかを指定します。この例では、モデルは TensorFlow 上で実行されます。 Azure Machine Learning には、必要なソフトウェアがインストールされた環境が既に用意されているため、この環境を再利用できます。 conda.yml ファイルに依存関係をいくつか追加する必要があります。
- Azure CLI
- Python
環境定義はデプロイファイルに含まれています。
```
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
```
環境への参照を取得します。
```
environment = Environment(
    name="tensorflow27-cuda11-gpu",
    conda_file="environment/conda.yml",
    image="mcr.microsoft.com/azureml/curated/tensorflow-2.7-ubuntu20.04-py38-cuda11-gpu:latest",
)
```

配置を作成します。

Azure CLI
Python

作成されたエンドポイントの下に新しいデプロイを作成するには、次の例のような YAML 構成を作成します。その他のプロパティについては、完全なバッチエンドポイント YAML スキーマを参照してください。

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: imagenet-classifier-batch
name: imagenet-classifier-resnetv2
description: A ResNetV2 model architecture for performing ImageNet classification in batch
type: model
model: azureml:imagenet-classifier@latest
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
  conda_file: environment/conda.yaml
code_configuration:
  code: code/score-by-file
  scoring_script: batch_driver.py
resources:
  instance_count: 2
settings:
  max_concurrency_per_instance: 1
  mini_batch_size: 5
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info

次のコマンドを使用してデプロイを作成します。

az ml batch-deployment create --file deployment-by-file.yml --endpoint-name $ENDPOINT_NAME --set-default

指定された環境とスコアリングスクリプトを使用して新しいデプロイを作成するには、次のコードを使用します。

deployment = BatchDeployment(
    name="imagenet-classifier-resnetv2",
    description="A ResNetV2 model architecture for performing ImageNet classification in batch",
    endpoint_name=endpoint.name,
    model=model,
    environment=environment,
    code_configuration=CodeConfiguration(
        code="code/score-by-file",
        scoring_script="batch_driver.py",
    ),
    compute=compute_name,
    instance_count=2,
    max_concurrency_per_instance=1,
    mini_batch_size=10,
    output_action=BatchDeploymentOutputAction.APPEND_ROW,
    output_file_name="predictions.csv",
    retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
    logging_level="info",
)

次のコマンドを使用してデプロイを作成します。

ml_client.batch_deployments.begin_create_or_update(deployment)

エンドポイント内の特定のデプロイを呼び出すこともできますが、通常はエンドポイント自体を呼び出し、どのデプロイを使用するかはエンドポイントに判断させます。このようなデプロイは、"既定" のデプロイと呼ばれます。

このアプローチでは、エンドポイントを呼び出すユーザーとのコントラクトを変更することなく、既定のデプロイを変更してデプロイを提供するモデルを変更することができます。既定のデプロイを更新するには、次のコードを使用します。
- Azure Machine Learning CLI
- Azure Machine Learning SDK for Python
```
az ml batch-endpoint update --name $ENDPOINT_NAME --set defaults.deployment_name=$DEPLOYMENT_NAME
```
```
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint)
```

これでバッチエンドポイントを使用する準備ができました。

展開をテスト

エンドポイントをテストするために、元の ImageNet データセットからの 1,000 個の画像のサンプルを使用します。バッチエンドポイントは、クラウド内にあり、Azure Machine Learning ワークスペースからアクセスできるデータのみを処理できます。それを Azure Machine Learning データストアにアップロードします。スコアリングのためにエンドポイントを呼び出すために使用できるデータ資産を作成します。

注

バッチエンドポイントが受け取るデータは、複数の種類の場所に配置できます。

関連するサンプルデータをダウンロードします。
- Azure CLI
- Python
```
wget "${IMAGENET_SAMPLE_URI_BASE}/imagenet-1000.zip"
unzip imagenet-1000.zip -d data
```
注

wget がローカルにインストールされていない場合は、それをインストールするか、ブラウザーを使用して .zip ファイルを取得します。
```
!wget https://azuremlexampledata.blob.core.windows.net/data/imagenet-1000.zip
!unzip imagenet-1000.zip -d data
```

ダウンロードしたデータからデータ資産を作成します。

Azure CLI
Python

以下のように YAML という名前のファイル内にデータ資産定義を作成します。

$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: imagenet-sample-unlabeled
description: A sample of 1000 images from the original ImageNet dataset. Download content from https://azuremlexampledata.blob.core.windows.net/data/imagenet-1000.zip.
type: uri_folder
path: data

データ資産を作成します。

az ml data create -f imagenet-sample-unlabeled.yml

次の値を指定します。

data_path = "data"
dataset_name = "imagenet-sample-unlabeled"

imagenet_sample = Data(
    path=data_path,
    type=AssetTypes.URI_FOLDER,
    description="A sample of 1000 images from the original ImageNet dataset",
    name=dataset_name,
)

データ資産を作成します。
```
ml_client.data.create_or_update(imagenet_sample)
```
新しく作成されたデータ資産を取得するには、次のコードを使用します。
```
imagenet_sample = ml_client.data.get(dataset_name, label="latest")
```

データがアップロードされ使用できるようになったら、エンドポイントを呼び出します。
- Azure CLI
- Python
```
JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input azureml:imagenet-sample-unlabeled@latest --query name -o tsv)
```
注

ユーティリティ jq がインストールされていない場合は、「jq のダウンロード」を参照してください。
ヒント

エンドポイントを呼び出すときのパラメーター inputs と input の違いは何ですか?

一般的には inputs = {} メソッドで辞書パラメーター invoke を使用すると、"モデルデプロイ" または "パイプラインデプロイ" を含むバッチエンドポイントに任意の個数の必須入力を与えることができます。

"モデルデプロイ" の場合は、デプロイの入力データの場所を指定する簡単な方法としてパラメーターを使用できます。input このアプローチが機能するのは、モデルデプロイが常に 1 つだけのデータ入力を受け取るためです。
```
input = Input(type=AssetTypes.URI_FOLDER, path=imagenet_sample.id)
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input,
)
```

ヒント

呼び出し操作ではデプロイ名を指定していません。これは、エンドポイントによってジョブが既定のデプロイに自動的にルーティングされるからです。エンドポイントにはデプロイが 1 つしかないため、そのデプロイが既定値となります。引数またはパラメーター deployment_name を指定することで、特定のデプロイをターゲットにできます。

バッチジョブはコマンドがリターンするとすぐに開始されます。完了するまでジョブの状態を監視できます。
- Azure CLI
- Python
```
az ml job show -n $JOB_NAME --web
```
```
ml_client.jobs.get(job.name)
```
デプロイが完了したら、予測をダウンロードします。
- Azure CLI
- Python
予測をダウンロードするには、次のコマンドを使用します。
```
az ml job download --name $JOB_NAME --output-name score --download-path ./
```
```
ml_client.jobs.download(name=job.name, output_name='score', download_path='./')
```

予測は以下の出力のようになります。読者の便宜上、予測はラベルと結合されています。この効果を実現する方法の詳細については、関連するノートブックを参照してください。

import pandas as pd
score = pd.read_csv("named-outputs/score/predictions.csv", header=None,  names=['file', 'class', 'probabilities'], sep=' ')
score['label'] = score['class'].apply(lambda pred: imagenet_labels[pred])
score

ファイル	クラス	確率	ラベル
n02088094_Afghan_hound.JPEG	161	0.994745	アフガン・ハウンド
n02088238_basset	162	0.999397	バセット
n02088364_beagle。JPEG	165	0.366914	bluetick
n02088466_bloodhound。JPEG	164	0.926464	ブラッドハウンド
...	...	...	...

高スループットのデプロイ

前述のように、バッチデプロイが画像のバッチを指定している場合でも、デプロイが一度に処理する画像は 1 つです。ほとんどの場合で、このアプローチが最適です。これにより、モデルの実行が簡略化され、起こり得るメモリ不足の問題が回避されます。しかし、それ以外の特定のケースでは、基盤ハードウェアを最大限に利用する必要があるかもしれません。このような状況ではたとえば、GPU が利用できます。

そのような場合、データのバッチ全体に対して推論を行う必要があるかもしれません。このアプローチでは、画像のセット全体をメモリに読み込み、それらをモデルに直接送信することになります。次の例では、TensorFlow を使用して画像のバッチを読み取り、それらを一度にスコアリングします。また、TensorFlow 操作を使用して何らかのデータの前処理を行います。パイプライン全体は、使用中の同じデバイス (CPU/GPU) で実行されます。

警告

一部のモデルでは、メモリ消費量の観点から入力のサイズと非線形の関係があります。メモリ不足の例外を回避するには、(この例で行ったように) 再度バッチ処理を行うか、バッチデプロイによって作成されるバッチのサイズを小さくします。

次のスコアリングスクリプト code/score-by-batch/batch_driver.py を作成します。

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow.keras.models import load_model


def init():
    global model
    global input_width
    global input_height

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)
    input_width = 244
    input_height = 244


def decode_img(file_path):
    file = tf.io.read_file(file_path)
    img = tf.io.decode_jpeg(file, channels=3)
    img = tf.image.resize(img, [input_width, input_height])
    return img / 255.0


def run(mini_batch):
    images_ds = tf.data.Dataset.from_tensor_slices(mini_batch)
    images_ds = images_ds.map(decode_img).batch(64)

    # perform inference
    pred = model.predict(images_ds)

    # Compute probabilities, classes and labels
    pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
    pred_class = tf.math.argmax(pred, axis=-1).numpy()

    return pd.DataFrame(
        [mini_batch, pred_prob, pred_class], columns=["file", "probability", "class"]
    )

このスクリプトは、バッチデプロイによって送信されたミニバッチからテンソルデータセットを構築します。このデータセットは、関数 map の decode_img 操作を使用して、モデルの予想されるテンソルを取得するために前処理されます。
このデータセットは、データをモデルに送信するために再度 (16) バッチ処理されます。このパラメーターを使用して、メモリに読み込み、一度にモデルに送信できる情報の量を制御します。 GPU で実行している場合は、OOM 例外がぎりぎり発生しない GPU の最大使用率を達成するようにこのパラメーターを慎重に調整する必要があります。
予測が計算されると、テンソルは numpy.ndarray に変換されます。

配置を作成します。

Azure CLI
Python

作成されたエンドポイントの下に新しいデプロイを作成するには、次の例のような YAML 構成を作成します。その他のプロパティについては、完全なバッチエンドポイント YAML スキーマを参照してください。

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: imagenet-classifier-batch
name: imagenet-classifier-resnetv2
description: A ResNetV2 model architecture for performing ImageNet classification in batch
type: model
model: azureml:imagenet-classifier@latest
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
  conda_file: environment/conda.yaml
code_configuration:
  code: code/score-by-batch
  scoring_script: batch_driver.py
resources:
  instance_count: 2
tags:
  device_acceleration: CUDA
  device_batching: 16
settings:
  max_concurrency_per_instance: 1
  mini_batch_size: 5
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info

次のコマンドを使用してデプロイを作成します。

az ml batch-deployment create --file deployment-by-batch.yml --endpoint-name $ENDPOINT_NAME --set-default

指定された環境とスコアリングスクリプトを使用して新しいデプロイを作成するには、次のコードを使用します。

deployment = BatchDeployment(
    name="imagenet-classifier-resnetv2",
    description="A ResNetV2 model architecture for performing ImageNet classification in batch",
    endpoint_name=endpoint.name,
    model=model,
    environment=environment,
    code_configuration=CodeConfiguration(
        code="code/score-by-batch",
        scoring_script="batch_driver.py",
    ),
    compute=compute_name,
    instance_count=2,
    tags={ "device_acceleration": "CUDA", "device_batching": "16" }
    max_concurrency_per_instance=1,
    mini_batch_size=10,
    output_action=BatchDeploymentOutputAction.APPEND_ROW,
    output_file_name="predictions.csv",
    retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
    logging_level="info",
)

次のコマンドを使用してデプロイを作成します。

ml_client.batch_deployments.begin_create_or_update(deployment)

この新しいデプロイは、先ほど示したサンプルデータと共に使用できます。このデプロイを呼び出すには、呼び出しメソッド内でデプロイの名前を指定するか、これを既定のデプロイとして設定する必要があることに注意してください。

画像を処理する MLflow モデルに関する考慮事項

Batch Endpoints の MLflow モデルでは、入力データとしての画像の読み取りがサポートされています。 MLflow デプロイではスコアリングスクリプトは必要ないため、使用する場合には次の点に注意してください。

サポートされる画像ファイルには、.png、.jpg、.jpeg、.tiff、.bmp、.gif などがあります。
MLflow モデルでは、入力として入力画像のサイズに一致する np.ndarray を受け取ることを想定する必要があります。各バッチで複数の画像サイズをサポートするために、バッチ Executor は画像ファイルごとに 1 回ずつ MLflow モデルを呼び出します。
MLflow モデルにはシグネチャを含めることが強く推奨されます。その場合は、それを TensorSpec タイプにする必要があります。入力はテンソルのシェイプと一致するように再シェイプされます (使用できる場合)。使用できるシグネチャがない場合、型 np.uint8 のテンソルが推論されます。
シグネチャを含み、さまざまなサイズの画像を処理することが予想されるモデルの場合は、それを保証できるシグネチャを含めます。たとえば、次のシグネチャの例では、3 つのチャネル化された画像のバッチを許容します。

import numpy as np
import mlflow
from mlflow.models.signature import ModelSignature
from mlflow.types.schema import Schema, TensorSpec

input_schema = Schema([
  TensorSpec(np.dtype(np.uint8), (-1, -1, -1, 3)),
])
signature = ModelSignature(inputs=input_schema)

(...)

mlflow.<flavor>.log_model(..., signature=signature)

実際の例は、Jupyter Notebook imagenet-classifier-mlflow.ipynb にあります。バッチデプロイで MLflow モデルを使用する方法の詳細については、「バッチデプロイでの MLflow モデルの使用」を参照してください。

次のステップ

フィードバック

このページはお役に立ちましたか?

Last updated on 2024-09-03