在批次端點中部署用於評分的模型

發行項
10/16/2024

適用於：Azure CLI ml 延伸模組 v2 (目前)Python SDK azure-ai-ml v2 (目前)

批次端點可讓您方便地部署用來對大量資料執行推斷的模型。這些端點可簡化針對 Batch 評分裝載模型的流程，讓您可以專注於機器學習，而非基礎結構。

請在此時機針對模型部署使用批次端點：

您有需要較長時間才能執行推斷的昂貴模型。
您必須對分散於多個檔案的大量資料執行推斷。
您沒有低延遲需求。
您可以利用平行處理。

在本文中，您會使用批次端點來部署機器學習模型，以解決傳統 MNIST (Modified National Institute of Standards and Technology，修改後的國家標準暨技術研究院) 數位辨識問題。接著，您的已部署模型會針對大量資料執行批次推斷，在此案例中為影像檔案。您會先從透過 Torch 建立的模型開始建立批次部署。此部署會成為端點中的預設部署。稍後，您將建立第二個部署，這會使用 TensorFlow (Keras) 所建立的模式，然後測試第二個部署並將其設定為端點的預設部署。

若要遵循在本機執行本文中命令所需的程式碼範例和檔案，請參閱複製範例存放庫一節。程式碼範例和檔案均已包含在 azureml-examples 存放庫中。

必要條件

遵循本文中的步驟之前，請確保您已滿足下列必要條件：

Azure 訂用帳戶。如果您沒有 Azure 訂用帳戶，請在開始前建立免費帳戶。試用免費或付費版本的 Azure Machine Learning。
Azure Machine Learning 工作區。如果您沒有工作區，請使用如何管理工作區一文中的步驟來建立。
為了執行下列工作，請確保您在工作區中具有下列權限：
- 建立/管理批次端點和部署：使用擁有者角色、參與者角色，或是允許 Microsoft.MachineLearningServices/workspaces/batchEndpoints/* 的自訂角色。
- 在工作區資源群組中建立 ARM 部署：在部署工作區的資源群組中使用擁有者角色、參與者角色，或是允許 Microsoft.Resources/deployments/write 的自訂角色。
您必須安裝下列軟體，才能使用 Azure Machine Learning：
適用於：Azure CLI ml 延伸模組 v2 (目前)

Azure CLI 和適用於 Azure Machine Learning 的 ml 延伸模組。
```
az extension add -n ml
```
適用於：Python SDK azure-ai-ml v2 (目前)

安裝適用於 Python 的 Azure Machine Learning SDK。
```
pip install azure-ai-ml
```
如果您打算使用 Azure Machine Learning 工作室，則沒有任何進一步的需求。

複製範例存放庫

本文中的範例是以 azureml-examples (英文) 存放庫內含的程式碼範例為基礎。若要在本機執行命令，而不需要複製/貼上 YAML 和其他檔案，請複製存放庫，然後將目錄變更為該資料夾：

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli/endpoints/batch/deploy-models/mnist-classifier

!git clone https://github.com/Azure/azureml-examples --depth 1
!cd azureml-examples/sdk/python/endpoints/batch/deploy-models/mnist-classifier

若要遵循這個在 Jupyter Notebook 中的範例，請在複製的存放庫中開啟筆記本：mnist-batch.ipynb。

準備您的系統

連線到您的工作區

首先，連線到您將在其中工作的 Azure Machine Learning 工作區。

如果您尚未設定 Azure CLI 的預設值，請儲存您的預設設定。若要避免多次傳遞訂閱、工作區、資源群組和位置的值，請執行下列程式碼：

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

工作區是 Azure Machine Learning 的最上層資源，其提供一個集中位置來處理您在使用 Azure Machine Learning 時建立的所有成品。在本節中，您會連線至要執行部署工作的工作區。

匯入必要的程式庫：

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

注意

類別 ModelBatchDeployment 和 PipelineComponentBatchDeployment 是在 SDK 1.7.0 版中引進的。

設定工作區詳細資料，並取得工作區的控制代碼：

subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

建立計算

批次端點會在計算叢集上執行，並同時支援 Azure Machine Learning 計算叢集 (AmlCompute) 和 Kubernetes 叢集。叢集是共用資源，因此一個叢集可以裝載一個或多個批次部署 (可視需求裝載其他工作負載)。

建立名稱為 batch-cluster 的計算，如下列程式碼所示。您可視需求調整，並使用 azureml:<your-compute-name> 來參考您的計算。

az ml compute create -n batch-cluster --type amlcompute --min-instances 0 --max-instances 5

compute_name = "batch-cluster"
if not any(filter(lambda m: m.name == compute_name, ml_client.compute.list())):
    compute_cluster = AmlCompute(
        name=compute_name,
        description="CPU cluster compute",
        min_instances=0,
        max_instances=2,
    )
    ml_client.compute.begin_create_or_update(compute_cluster).result()

注意

此時您不需支付計算費用，因為在叫用批次端點並提交批次評分作業之前，叢集將維持在 0 個節點。如需計算成本的詳細資訊，請參閱管理及最佳化 AmlCompute 的成本。

建立批次端點

「批次端點」是用戶端可以呼叫以觸發「批次評分作業」的 HTTPS 端點。「批次評分作業」是評分多個輸入的工作。「批次部署」是一組計算資源，其裝載可執行實際批次評分 (或批次推斷) 的模型。一個 Batch 端點可以有多個 Batch 部署。如需批次端點的詳細資訊，請參閱什麼是批次端點？。

提示

其中一個批次部署將作為端點的預設部署。叫用端點時，預設部署會進行實際批次評分。如需批次端點和部署的詳細資訊，請參閱批次端點和批次部署。

命名端點。 端點的名稱在 Azure 區域中必須是唯一的，因為該名稱會包含在端點的 URI 中。例如，westus2 中只能有一個名稱為 mybatchendpoint 的批次端點。
將端點的名稱放在變數中，以便稍後輕鬆進行參考。
```
ENDPOINT_NAME="mnist-batch"
```
將端點的名稱放在變數中，以便稍後輕鬆進行參考。
```
endpoint_name = "mnist-batch"
```
您稍後會在建立部署時提供端點的名稱。

設定批次端點

下列 YAML 檔案會定義批次端點。您可以透過 CLI 命令中使用此檔案，以便建立批次端點。

endpoint.yml

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: mnist-batch
description: A batch endpoint for scoring images from the MNIST dataset.
tags:
  type: deep-learning

下表描述端點的重要屬性。如需完整的 Batch 端點 YAML 結構描述，請參閱 CLI (v2) Batch 端點 YAML 結構描述。

關鍵	描述
`name`	Batch 端點的名稱。在 Azure 區域層級必須是唯一的。
`description`	批次端點的描述。這個屬性為選擇性。
`tags`	要包含在端點中的標籤。這個屬性為選擇性。

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="A batch endpoint for scoring images from the MNIST dataset.",
    tags={"type": "deep-learning"},
)

下表描述端點的重要屬性。如需批次端點定義的詳細資訊，請參閱 BatchEndpoint 類別。

關鍵	描述
`name`	Batch 端點的名稱。在 Azure 區域層級必須是唯一的。
`description`	批次端點的描述。這個屬性為選擇性。
`tags`	要包含在端點中的標籤。這個屬性為選擇性。

建立端點：
執行下列程式碼以建立批次端點。
```
az ml batch-endpoint create --file endpoint.yml  --name $ENDPOINT_NAME
```
```
ml_client.begin_create_or_update(endpoint).result()
```
您稍後會在建立部署時建立端點。

建立 Batch 部署

模型部署是一組用於裝載實際執行推斷的模型所需的資源。若要建立批次模型部署，您需要下列項目：

工作區中的已註冊模型
用來評分模型的程式碼
已安裝模型相依性的環境
預先建立的計算和資源設定

註冊要部署的模型，這是針對熱門數字辨識問題的 Torch 模型 (MNIST)。批次部署只能部署已在工作區中註冊的模型。如果您已註冊想要部署的模型，則可以略過此步驟。

提示

模型會與部署相關聯，而不是與端點相關聯。這表示只要不同的模型 (或模型版本) 部署在不同的部署中，單一端點就可以在相同的端點下提供不同的模型 (或模型版本)。
```
MODEL_NAME='mnist-classifier-torch'
az ml model create --name $MODEL_NAME --type "custom_model" --path "deployment-torch/model"
```
```
model_name = "mnist-classifier-torch"
model_local_path = "deployment-torch/model/"

model = ml_client.models.create_or_update(
    Model(
        name=model_name,
        path=model_local_path,
        type=AssetTypes.CUSTOM_MODEL,
        tags={"task": "classification", "framework": "torch"},
    )
)
```
1. 瀏覽至側邊功能表上的 [模型] 索引標籤。
2. 選取 [註冊]>[從本機檔案]。
3. 在精靈中，將 [模型類型] 選項保留為 [未指定類型]。
4. 選取 [瀏覽]>[瀏覽資料夾] 選取資料夾 deployment-torch/model>> [下一步]。
5. 設定模型的名稱：mnist-classifier-torch。您可以保留其餘欄位的預設值。
6. 選取註冊。

現在可以建立評分指令碼了。批次部署需要評分指令碼，以指出應該如何執行指定的模型，以及必須如何處理輸入資料。批次端點支援在 Python 中所建立的指令碼。在此案例中，您會部署模型來讀取代表數字的影像檔，並輸出對應的數字。評分指令碼如下所示：

注意

針對 MLflow 模型，Azure Machine Learning 會自動產生評分指令碼，因此您不需要提供評分指令碼。如果您的模型是 MLflow 模型，您可以略過此步驟。如需批次端點如何使用 MLflow 模型的詳細資訊，請參閱在批次部署中使用 MLflow 模型文章。

警告

若您要在批次端點下部署自動化機器學習 (AutoML) 模型，請注意 AutoML 提供的評分指令碼僅適用於線上端點，而並非針對批次執行所設計。如需如何針對批次部署建立評分指令碼的資訊，請參閱撰寫批次部署的評分指令碼。

deployment-torch/code/batch_driver.py

import os
import pandas as pd
import torch
import torchvision
import glob
from os.path import basename
from mnist_classifier import MnistClassifier
from typing import List


def init():
    global model
    global device

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    # It is the path to the model folder
    model_path = os.environ["AZUREML_MODEL_DIR"]
    model_file = glob.glob(f"{model_path}/*/*.pt")[-1]

    model = MnistClassifier()
    model.load_state_dict(torch.load(model_file))
    model.eval()

    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")


def run(mini_batch: List[str]) -> pd.DataFrame:
    print(f"Executing run method over batch of {len(mini_batch)} files.")

    results = []
    with torch.no_grad():
        for image_path in mini_batch:
            image_data = torchvision.io.read_image(image_path).float()
            batch_data = image_data.expand(1, -1, -1, -1)
            input = batch_data.to(device)

            # perform inference
            predict_logits = model(input)

            # Compute probabilities, classes and labels
            predictions = torch.nn.Softmax(dim=-1)(predict_logits)
            predicted_prob, predicted_class = torch.max(predictions, axis=-1)

            results.append(
                {
                    "file": basename(image_path),
                    "class": predicted_class.numpy()[0],
                    "probability": predicted_prob.numpy()[0],
                }
            )

    return pd.DataFrame(results)

建立您執行批次部署所在的環境。該環境應包含批次端點所需的套件 azureml-core 和 azureml-dataset-runtime[fuse]，以及程式碼為了執行所需的任何相依性。在此案例中，已在 conda.yaml 檔案中擷取相依性：

deployment-torch/environment/conda.yaml
```
name: mnist-env
channels:
  - conda-forge
dependencies:
  - python=3.8.5
  - pip<22.0
  - pip:
    - torch==1.13.0
    - torchvision==0.14.0
    - pytorch-lightning
    - pandas
    - azureml-core
    - azureml-dataset-runtime[fuse]
```
重要

azureml-core 和 azureml-dataset-runtime[fuse] 是批次部署所需的套件，應該包含在環境相依性中。

指定環境，如下所示：
環境定義會以匿名環境的形式包含在部署定義本身。您將在部署的下列幾行中看到：
```
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
取得對環境的參考：
```
env = Environment(
    name="batch-torch-py38",
    conda_file="deployment-torch/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```
在 Azure Machine Learning 工作室中遵循下列步驟：
1. 瀏覽至側邊功能表上的 [環境] 索引標籤。
2. 選取 [自訂環境] 索引標籤 > [建立]。
3. 輸入環境的名稱，在此案例中為 torch-batch-env。
4. 針對 [選取環境來源]，選取 [搭配選用 Conda 檔案使用現有的 Docker 映像]。
5. 針對 [容器登錄映像路徑]，輸入 mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04。
6. 選取 [下一步] 以前往 [自訂] 區段。
7. 將檔案 deployment-torch/environment/conda.yaml 的內容從 GitHub 存放庫複製至入口網站。
8. 選取 [下一步]，直到到達 [檢閱頁面] 為止。
9. 選取 [建立]，並等到環境準備就緒可使用為止。
警告

批次部署不支援策展環境。您需要指定自己的環境。您一律可以使用策展環境的基礎映像作為自己的映像以簡化程序。

建立部署定義

deployment-torch/deployment.yml

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-torch-dpl
description: A deployment using Torch to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model:
  name: mnist-classifier-torch
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 30
  error_threshold: -1
  logging_level: info

下表描述批次部署的重要屬性。如需完整 Batch 部署 YAML 結構描述，請參閱 CLI (v2) Batch 部署 YAML 結構描述。

關鍵	描述
`name`	部署的名稱。
`endpoint_name`	要在其下建立部署的端點名稱。
`model`	用於 Batch 評分的模型。此範例會使用 `path` 定義內嵌模型。此定義允許自動上傳模型檔案，並使用自動產生的名稱和版本註冊。請參閱模型結構描述以取得更多選項。作為生產案例的最佳做法，您應該個別建立模型並在這裡參考該模型。若要參考現有的模型，請使用 `azureml:<model-name>:<model-version>` 語法。
`code_configuration.code`	用於模型評分的所有 Python 原始程式碼目錄。
`code_configuration.scoring_script`	上述 `code_configuration.code` 目錄中的 Python 檔案。這個檔案必須有一個 `init()` 函式和個 `run()` 函式。將 `init()` 函式用於任何昂貴或一般的準備 (例如，將模型載入記憶體)。 `init()` 將僅會在流程開始時呼叫一次。使用 `run(mini_batch)` 來為每個項目評分；`mini_batch` 的值為檔案路徑的清單。 `run()` 函式應該傳回 Pandas 資料框架或陣列。每個傳回的元素表示 `mini_batch` 中輸入元素的一個成功執行。若需了解撰寫評分指令碼的詳細資訊，請參閱了解評分指令碼。
`environment`	用來評分模型的環境。範例會使用 `conda_file` 和 `image` 定義內嵌環境。 `conda_file` 相依性將安裝在 `image` 上。系統會以自動產生的名稱和版本註冊環境。請參閱環境結構描述以取得更多選項。作為生產案例的最佳做法，您應該個別建立環境並在這裡參考該環境。若要參考現有的環境，請使用 `azureml:<environment-name>:<environment-version>` 語法。
`compute`	要執行 Batch 評分的計算。範例會使用在開頭時建立的 `batch-cluster`，並使用 `azureml:<compute-name>` 語法來參考。
`resources.instance_count`	每個 Batch 評分作業要使用的執行個體數目。
`settings.max_concurrency_per_instance`	每個執行個體的平行 `scoring_script` 執行數目上限。
`settings.mini_batch_size`	`scoring_script` 可以在一個 `run()` 呼叫中處理的檔案數目。
`settings.output_action`	輸出應在輸出檔案中的組織方式。 `append_row` 會將所有 `run()` 傳回的輸出結果合併成一個名為 `output_file_name` 的單一檔案。 `summary_only` 不會合併輸出結果，且只會計算 `error_threshold`。
`settings.output_file_name`	`append_row` `output_action` 的 Batch 評分輸出檔案名稱。
`settings.retry_settings.max_retries`	失敗的 `scoring_script` `run()` 嘗試次數。
`settings.retry_settings.timeout`	用於評分迷你 Batch 的 `scoring_script` `run()` 逾時 (以秒為單位)。
`settings.error_threshold`	應忽略的輸入檔案評分失敗數目。如果整個輸入的錯誤計數超過此值，Batch 評分作業便會終止。此範例會使用 `-1`，這表示會允許任何數目的失敗，而不需要終止 Batch 評分作業。
`settings.logging_level`	記錄詳細程度。增加詳細程度中的值為：WARNING、INFO 和 DEBUG。
`settings.environment_variables`	要針對每個 Batch 評分作業設定的環境變數名稱-值組的字典。

deployment = ModelBatchDeployment(
    name="mnist-torch-dpl",
    description="A deployment using Torch to solve the MNIST classification dataset.",
    endpoint_name=endpoint_name,
    model=model,
    code_configuration=CodeConfiguration(
        code="deployment-torch/code/", scoring_script="batch_driver.py"
    ),
    environment=env,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        instance_count=2,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=30),
        logging_level="info",
    ),
)

BatchDeployment 類別可讓您設定批次部署的下列主要屬性：

關鍵	描述
`name`	部署的名稱。
`endpoint_name`	要在其下建立部署的端點名稱。
`model`	要用於部署的模型。此值可以是工作區中現有已建立版本模型的參考，也可以是內嵌模型規格。
`environment`	要用於部署的環境。此值可以是工作區中現有已建立版本環境的參考，也可以是內嵌環境規格 (對於 MLflow 模型是選擇性的)。
`code_configuration`	有關如何為模型執行推斷的設定 (對於 MLflow 模型是選擇性的)。
`code_configuration.code`	用來評分模型的原始程式碼目錄的路徑。
`code_configuration.scoring_script`	原始程式碼目錄中評分檔案的相對路徑。
`compute`	要執行批次評分作業的計算目標名稱。
`instance_count`	要對每個 Batch 評分作業使用的節點數目。
`settings`	模型部署推斷設定。
`settings.max_concurrency_per_instance`	每個執行個體的平行 `scoring_script` 執行數目上限。
`settings.mini_batch_size`	`code_configuration.scoring_script` 可以在一個 `run`() 呼叫中處理的檔案數目。
`settings.retry_settings`	用於評分每個迷你 Batch 的重試設定。
`settings.retry_settingsmax_retries`	針對失敗或逾時的迷你批次重試次數上限 (預設值為 3)。
`settings.retry_settingstimeout`	針對評分迷你批次的逾時 (以秒為單位，預設值為 30)。
`settings.output_action`	輸出應在輸出檔案中的組織方式。允許值為`append_row`或`summary_only`。預設值為 `append_row`。
`settings.logging_level`	記錄詳細程度層級。允許的值包括 `warning`、`info`、`debug`。預設值為 `info`。
`settings.environment_variables`	要針對每個 Batch 評分作業設定的環境變數名稱-值組的字典。

在工作室中，請遵循下列步驟：

瀏覽至側邊功能表上的 [端點] 索引標籤。
選取 [批次端點] 索引標籤 > [建立]。
為端點指定名稱，在此案例中為 mnist-batch。您可以設定其餘欄位，或將其保留空白。
選取 [下一步] 以前往 [模型] 區段。
選取模型 mnist-classifier-torch。
選取 [下一步] 以前往 [部署] 頁面。
為部署指定名稱。
針對 [輸出動作]，請確保已選取 [附加資料列]。
針對 [輸出檔案名稱]，請確保批次評分輸出檔案是您需要的輸出檔案。預設值為 predictions.csv。
針對 [迷你批次大小]，請調整每個迷你批次上將會包含的檔案大小。此大小會控制每個批次所接收評分指令碼的資料量。
針對 [評分逾時 (秒)]，請確保您有足夠的時間讓部署為指定檔案批次評分。如果您增加檔案數目，通常也必須增加逾時值。更昂貴的模型 (例如以深度學習為基礎的模型)，在此欄位中可能需要高值。
針對 [每個執行個體的並行上限]，請設定對您在部署中所取得每個計算執行個體，所想要擁有的執行程式數目。此處較高的數字可保證較高的平行處理程度，但是也會增加計算執行個體的記憶體壓力。使用 [迷你批次大小] 來一起調整此值。
完成後，請選取 [下一步] 以前往 [程式碼 + 環境] 頁面。
針對 [選取推斷的評分指令碼]，請瀏覽以尋找並選取評分指令碼檔案 deployment-torch/code/batch_driver.py。
在 [選取環境] 區段中，選取您先前所建立的環境 torch-batch-env。
選取 [下一步] 以移至 [計算] 頁面。
選取您在先前步驟中所建立的計算叢集。

警告

批次部署支援 Azure Kubernetes 叢集，但是只有在使用 Azure Machine Learning CLI 或 Python SDK 建立時才支援。
針對 [執行個體計數]，請輸入您想要用於部署的計算執行個體數目。在此案例中，請使用 2。
選取 [下一步]。

建立部署：
執行下列程式碼，在批次端點下建立批次部署，並將其設定為預設部署。
```
az ml batch-deployment create --file deployment-torch/deployment.yml --endpoint-name $ENDPOINT_NAME --set-default
```
提示

--set-default 參數會將新建立的部署設定為端點的預設部署。這是建立新端點預設部署的便利方式，特別是在第一次建立部署時。作為生產案例的最佳做法，您可能會想要建立新的部署，而不是將其設定為預設值。確認部署如預期般運作，之後再更新預設部署。如需實作此流程的詳細資訊，請參閱部署新模型一節。
使用稍早建立的 MLClient 在工作區中建立部署。此命令會啟動部署建立，並在部署建立繼續時傳回確認回應。
```
ml_client.begin_create_or_update(deployment).result()
```
部署完成後，請將新的部署設定為端點中的預設部署：
```
endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
在精靈中，選取 [建立] 以開始部署程序。
檢查批次端點和部署詳細資料。
使用 show 來檢查端點和部署詳細資料。若要檢查 Batch 部署，請執行下列程式碼：
```
DEPLOYMENT_NAME="mnist-torch-dpl"
az ml batch-deployment show --name $DEPLOYMENT_NAME --endpoint-name $ENDPOINT_NAME
```
若要檢查 Batch 部署，請執行下列程式碼：
```
ml_client.batch_deployments.get(name=deployment.name, endpoint_name=endpoint.name)
```
建立批次端點後，端點的詳細資料頁面隨即開啟。您也可以遵循下列步驟找到此頁面：
1. 瀏覽至側邊功能表上的 [端點] 索引標籤。
2. 選取 [批次端點] 索引標籤。
3. 選取您想要檢視的批次端點。
4. 在端點的 [詳細資料] 頁面中，您會看到端點的所有詳細資料以及所有端點中可取得的部署。

執行批次端點和存取結果

叫用批次端點會觸發批次評分作業。作業 name 會從叫用回應中傳回，並且可用於追蹤批次評分進度。在批次端點中執行評分模型時，您必須指定輸入資料的路徑，以讓端點能找到您想要評分的資料。下列範例示範如何針對儲存在 Azure 儲存體帳戶中的 MNIST 資料集範例資料，啟動新的作業。

您可以使用 Azure CLI、Azure Machine Learning SDK 或 REST 端點來執行和叫用批次端點。如需這些選項的詳細資訊，請參閱建立批次端點的作業和輸入資料。

注意

平行處理如何運作？

批次部署會在檔案層級散發工作，這表示包含 100 個檔案、迷你批次為 10 個檔案的資料夾，會產生 10 個批次，每個批次各有 10 個檔案。請注意，不論涉及的檔案大小為何，都會發生這種情況。若檔案太大而無法在大型迷你批次中處理，我們建議您將檔案分割成較小的檔案，以達到較高層級的平行處理原則，或減少每個迷你批次的檔案數目。目前，批次部署無法將檔案大小散發中的扭曲納入考量。

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --input-type uri_folder --query name -o tsv)

提示

叫用端點時，inputs 和 input 參數之間有何差異？

一般而言，您可以使用字典 inputs = {} 參數搭配 invoke 方法，為批次端點提供任意數目的必要輸入，其中包含模型部署或管線部署。

就模型部署而言，您可以使用 input 參數作為較簡易的方式，以指定部署的輸入資料位置。這種方法很有用，因為模型部署只要一個資料輸入即可。

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment.name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
)

瀏覽至側邊功能表上的 [端點] 索引標籤。
選取 [批次端點] 索引標籤。
選取您剛才建立的批次端點。
選取 [建立作業]。
針對 [部署]，請選取您要執行的部署。
選取 [下一步] 以前往 [選取資料來源] 頁面。
針對 [資料來源類型]，請選取 [資料存放區]。
針對 [資料存放區]，請從下拉式功能表中選取 [workspaceblobstore]。
針對 [路徑]，請輸入完整的 URL https://azuremlexampledata.blob.core.windows.net/data/mnist/sample。

提示

此路徑僅在指定路徑已啟用公用存取時，才能運作。一般而言，您需要將資料來源註冊為 [資料存放區]。如需詳細資訊，請參閱從批次端點作業存取資料。
選取 [下一步]。
選取 [建立] 以開始作業。

批次端點支援讀取位於不同位置的檔案或資料夾。若要深入了解支援的類型及如何加以指定，請參閱從批次端點作業存取資料。

監視批次作業執行進度

Batch 評分作業通常需要一些時間來處理整個輸入集。

下列程式碼會檢查作業狀態，並輸出 Azure Machine Learning 工作室的連結以取得進一步的詳細資料。

az ml job show -n $JOB_NAME --web

下列程式碼會檢查作業狀態，並輸出 Azure Machine Learning 工作室的連結以取得進一步的詳細資料。

ml_client.jobs.get(job.name)

檢查批次評分結果

作業輸出會儲存在雲端儲存空間中，可以是工作區的預設 Blob 儲存體中，或是您所指定的儲存空間。若要了解如何變更預設值，請參閱設定輸出位置。作業完成時，下列步驟將可讓您檢視 Azure 儲存體總管中的評分結果：

執行下列程式碼，以在 Azure Machine Learning 工作室中開啟批次評分作業。 invoke 的回應中也包含了作業的工作室連結，做為 interactionEndpoints.Studio.endpoint 的值。
```
az ml job show -n $JOB_NAME --web
```
在執行的圖表中，選取 batchscoring 步驟。
選取 [輸出 + 記錄] 索引標籤，然後選取 [顯示資料輸出]。
從 [資料輸出] 中，選取圖示以開啟儲存體總管。

儲存體總管中的評分結果類似下列範例頁面：

設定輸出位置

依預設，批次評分結果會儲存在工作區的預設 Blob 存放區，位於依作業命名 (系統產生的 GUID) 的資料夾內。您可以設定在叫用 Batch 端點時，儲存評分輸出的位置。

使用 output-path 可在 Azure Machine Learning 已註冊的資料存放區中設定任何資料夾。當您指定資料夾時，--output-path 的語法與 --input 相同，也就是 azureml://datastores/<datastore-name>/paths/<path-on-datastore>/。使用 --set output_file_name=<your-file-name> 來設定新的輸出檔案名稱。

OUTPUT_FILE_NAME=predictions_`echo $RANDOM`.csv
OUTPUT_PATH="azureml://datastores/workspaceblobstore/paths/$ENDPOINT_NAME"

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --output-path $OUTPUT_PATH --set output_file_name=$OUTPUT_FILE_NAME --query name -o tsv)

使用 params_override 可在 Azure Machine Learning 已註冊的資料存放區中設定任何資料夾。僅支援以已註冊的資料存放區作為輸出路徑。在此範例中，您會使用預設資料存放區：

batch_ds = ml_client.datastores.get_default()

識別出您想要使用的資料存放區後，請設定輸出，如下所示：

filename = f"predictions-{random.randint(0,99999)}.csv"

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
    params_override=[
        {"output_dataset.datastore_id": f"azureml:{batch_ds.id}"},
        {"output_dataset.path": f"/{endpoint_name}/"},
        {"output_file_name": filename},
    ],
)

警告

您必須使用唯一的輸出位置。如果輸出檔案存在，Batch 評分作業將會失敗。

重要

與輸入不同，輸出只能儲存在 Blob 儲存體帳戶上執行的 Azure Machine Learning 資料存放區中。

覆寫每個作業的部署組態

您在叫用批次端點時，可以覆寫部分設定以充分利用計算資源並改善效能。下列設定可以在個別作業中設定：

執行個體計數：使用此設定以覆寫從計算叢集要求的執行個體數目。例如，針對較大量的資料輸入，您可能會想要使用更多執行個體來加速端對端 Batch 評分。
迷你批次大小：使用此設定以覆寫要包含在每個迷你批次中的檔案數目。迷你批次的數目取決於總輸入檔案計數和迷你批次大小。較小的迷你批次大小會產生更多的迷你批次。迷你 Batch 可以平行執行，但可能會有額外的排程和叫用負荷。
其他設定如 [重試次數上限]、[逾時] 和 [錯誤閾值] 均可覆寫。這些設定可能會影響不同工作負載的端對端批次評分時間。

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --mini-batch-size 20 --instance-count 5 --query name -o tsv)

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/"
    ),
    params_override=[{"mini_batch_size": "20"}, {"compute.instance_count": "5"}],
)

將部署新增至端點

擁有具備部署的批次端點之後，您可以繼續調整您的模型，並新增部署。當您在相同端點下開發及部署新模型時，批次端點會繼續提供預設部署。部署不會影響彼此。

在此範例中，您會新增使用透過 Keras 和 TensorFlow 所建置模型的第二個部署，以解決相同的 MNIST 問題。

新增第二個部署

建立您執行批次部署所在的環境。在環境中包含您的程式碼執行所需的任何相依性。您也需要新增程式庫 azureml-core，因為批次部署需要該程式庫才能運作。下列環境定義具有使用 TensorFlow 執行模型所需的程式庫。
環境定義會以匿名環境的形式包含在部署定義本身。
```
environment:
  name: batch-tensorflow-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
取得對環境的參考：
```
env = Environment(
    name="batch-tensorflow-py38",
    conda_file="deployment-keras/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```
1. 瀏覽至側邊功能表上的 [環境] 索引標籤。
2. 選取 [自訂環境] 索引標籤 > [建立]。
3. 輸入環境的名稱，在此案例中為 keras-batch-env。
4. 針對 [選取環境來源]，選取 [搭配選用 Conda 檔案使用現有的 Docker 映像]。
5. 針對 [容器登錄映像路徑]，輸入 mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04。
6. 選取 [下一步] 以前往 [自訂] 區段。
7. 將檔案 deployment-keras/environment/conda.yaml 的內容從 GitHub 存放庫複製至入口網站。
8. 選取 [下一步]，直到到達 [檢閱頁面] 為止。
9. 選取 [建立]，並等到環境準備就緒可使用為止。
所使用的 conda 檔案如下所示：

deployment-keras/environment/conda.yaml
```
name: tensorflow-env
channels:
  - conda-forge
dependencies:
  - python=3.8.5
  - pip
  - pip:
    - pandas
    - tensorflow
    - pillow
    - azureml-core
    - azureml-dataset-runtime[fuse]
```

為模型建立評分指令碼：

deployment-keras/code/batch_driver.py

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from typing import List
from os.path import basename
from PIL import Image
from tensorflow.keras.models import load_model


def init():
    global model

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)


def run(mini_batch: List[str]) -> pd.DataFrame:
    print(f"Executing run method over batch of {len(mini_batch)} files.")

    results = []
    for image_path in mini_batch:
        data = Image.open(image_path)
        data = np.array(data)
        data_batch = tf.expand_dims(data, axis=0)

        # perform inference
        pred = model.predict(data_batch)

        # Compute probabilities, classes and labels
        pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
        pred_class = tf.math.argmax(pred, axis=-1).numpy()

        results.append(
            {
                "file": basename(image_path),
                "class": pred_class[0],
                "probability": pred_prob,
            }
        )

    return pd.DataFrame(results)

建立部署定義
deployment-keras/deployment.yml
```
$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-keras-dpl
description: A deployment using Keras with TensorFlow to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model: 
  name: mnist-classifier-keras
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-tensorflow-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
```
```
deployment_keras = ModelBatchDeployment(
    name="mnist-keras-dpl",
    description="A deployment using Keras to solve the MNIST classification dataset.",
    endpoint_name=endpoint_name,
    model=model,
    code_configuration=CodeConfiguration(
        code="deployment-keras/code/", scoring_script="batch_driver.py"
    ),
    environment=env,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        instance_count=2,
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=30),
        logging_level="info",
    ),
)
```
1. 瀏覽至側邊功能表上的 [端點] 索引標籤。
2. 選取 [批次端點] 索引標籤。
3. 選取您要在其中新增部署的現有批次端點。
4. 選取 [新增部署]。
5. 選取 [下一步] 以前往 [模型] 頁面。
6. 在模型清單中選取模型 mnist，然後選取 [下一步]。
7. 在 [部署組態] 頁面上，為部署指定名稱。
8. 複原選項的選取項目：將此新部署設為批次作業的預設值。
9. 針對 [輸出動作]，請確保已選取 [附加資料列]。
10. 針對 [輸出檔案名稱]，請確保批次評分輸出檔案是您需要的輸出檔案。預設值為 predictions.csv。
11. 針對 [迷你批次大小]，請調整每個迷你批次中將會包含的檔案大小。這會控制每個批次接收到的評分指令碼資料量。
12. 針對 [評分逾時 (秒)]，請確保您有足夠的時間讓部署為指定檔案批次評分。如果您增加檔案數目，通常也必須增加逾時值。更昂貴的模型 (例如以深度學習為基礎的模型)，在此欄位中可能需要高值。
13. 針對 [每個執行個體的並行上限]，請設定對您在部署中所取得每個計算執行個體，所想要擁有的執行程式數目。此處較高的數字可保證較高的平行處理程度，但是也會增加計算執行個體的記憶體壓力。使用 [迷你批次大小] 來一起調整此值。
14. 選取 [下一步] 以前往 [程式碼 + 環境] 頁面。
15. 針對 [選取推斷的評分指令碼]，請瀏覽以選取評分指令碼檔案 deployment-keras/code/batch_driver.py。
16. 針對 [選取環境]，請選取您在先前步驟中建立的環境。
17. 選取 [下一步]。
18. 在 [計算] 頁面上，選取您在先前步驟中建立的計算叢集。
19. 針對 [執行個體計數]，請輸入您想要用於部署的計算執行個體數目。在此案例中，請使用 2。
20. 選取 [下一步]。
建立部署：
- Azure CLI
- Python
- Studio
執行下列程式碼，在批次端點下建立批次部署，並將其設定為預設部署。
```
az ml batch-deployment create --file deployment-keras/deployment.yml --endpoint-name $ENDPOINT_NAME
```
提示

在此情況下，遺漏 --set-default 參數。作為生產案例的最佳做法，請建立新的部署，而不是將其設定為預設值。然後加以驗證，並在之後更新預設部署。
使用稍早建立的 MLClient 在工作區中建立部署。此命令會啟動部署建立，並在部署建立繼續時傳回確認回應。
```
ml_client.begin_create_or_update(deployment_keras).result()
```
在精靈中，選取 [建立] 以開始部署程序。

測試非預設 Batch 部署

若要測試新的非預設部署，您會需要知道想要執行的部署名稱。

DEPLOYMENT_NAME="mnist-keras-dpl"
JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --deployment-name $DEPLOYMENT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --input-type uri_folder --query name -o tsv)

請注意，--deployment-name 是用來指定要執行的部署。此參數可讓您 invoke 非預設部署，而不會更新批次端點的預設部署。

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment_keras.name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
)

請注意，deployment_name 是用來指定要執行的部署。此參數可讓您 invoke 非預設部署，而不會更新批次端點的預設部署。

更新預設 Batch 部署

雖然您可以在端點內叫用特定部署，但是您通常會想要叫用端點本身，並讓端點決定要使用的部署：預設部署。您可以變更預設部署 (進而變更提供部署的模型)，而不需變更與叫用端點使用者之間的合約。使用下列程式碼來更新預設部署：

az ml batch-endpoint update --name $ENDPOINT_NAME --set defaults.deployment_name=$DEPLOYMENT_NAME

endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment_keras.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()

刪除 Batch 端點和部署

若您不打算使用舊的批次部署，請執行下列程式碼加以刪除。 --yes 用來確認刪除。

az ml batch-deployment delete --name mnist-torch-dpl --endpoint-name $ENDPOINT_NAME --yes

執行下列程式碼以刪除批次端點和所有基礎部署。將不會刪除批次評分作業。

az ml batch-endpoint delete --name $ENDPOINT_NAME --yes

若您不打算使用舊的批次部署，請執行下列程式碼加以刪除。

ml_client.batch_deployments.begin_delete(
    endpoint_name=endpoint_name, name=deployment.name
).result()

執行下列程式碼以刪除批次端點和所有基礎部署。將不會刪除批次評分作業。

ml_client.batch_endpoints.begin_delete(name=endpoint_name)

共用方式為

在批次端點中部署用於評分的模型

必要條件

複製範例存放庫

準備您的系統

連線到您的工作區

建立計算

建立批次端點

建立 Batch 部署

執行批次端點和存取結果

監視批次作業執行進度

檢查批次評分結果

設定輸出位置

覆寫每個作業的部署組態

將部署新增至端點

新增第二個部署

測試非預設 Batch 部署

更新預設 Batch 部署

刪除 Batch 端點和部署

意見反應

其他資源

共用方式為

在批次端點中部署用於評分的模型

必要條件

複製範例存放庫

準備您的系統

連線到您的工作區

建立計算

建立批次端點

建立 Batch 部署

執行批次端點和存取結果

監視批次作業執行進度

檢查批次評分結果

設定輸出位置

覆寫每個作業的部署組態

將部署新增至端點

新增第二個部署

測試非預設 Batch 部署

更新預設 Batch 部署

刪除 Batch 端點和部署

相關內容

意見反應

其他資源