Wdrażanie modeli oceniania w punktach końcowych wsadowych

Artykuł
04/07/2024

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)

Punkty końcowe usługi Batch zapewniają wygodny sposób wdrażania modeli, które uruchamiają wnioskowanie na dużych ilościach danych. Te punkty końcowe upraszczają proces hostowania modeli na potrzeby oceniania wsadowego, dzięki czemu koncentrujesz się na uczeniu maszynowym, a nie na infrastrukturze.

Użyj punktów końcowych wsadowych do wdrażania modelu, gdy:

Masz kosztowne modele, które wymagają dłuższego czasu na wnioskowanie.
Należy przeprowadzić wnioskowanie na dużych ilościach danych, które są dystrybuowane w wielu plikach.
Nie masz wymagań dotyczących małych opóźnień.
Możesz skorzystać z równoległości.

W tym artykule użyjesz punktu końcowego wsadowego do wdrożenia modelu uczenia maszynowego, który rozwiązuje klasyczny problem rozpoznawania cyfr MNIST (zmodyfikowany Narodowy Instytut Standardów i Technologii). Wdrożony model wykonuje następnie wnioskowanie wsadowe na dużych ilościach danych — w tym przypadku pliki obrazów. Zacznij od utworzenia wdrożenia wsadowego modelu, który został utworzony przy użyciu platformy Torch. To wdrożenie staje się domyślne w punkcie końcowym. Później utworzysz drugie wdrożenie trybu, który został utworzony za pomocą biblioteki TensorFlow (Keras), przetestujesz drugie wdrożenie, a następnie ustawisz je jako domyślne wdrożenie punktu końcowego.

Aby postępować zgodnie z przykładami kodu i plikami wymaganymi do uruchamiania poleceń w tym artykule lokalnie, zobacz sekcję Klonowanie repozytorium przykładów. Przykłady kodu i pliki znajdują się w repozytorium azureml-examples .

Wymagania wstępne

Przed wykonaniem kroków opisanych w tym artykule upewnij się, że masz następujące wymagania wstępne:

Subskrypcja platformy Azure. Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto. Wypróbuj bezpłatną lub płatną wersję usługi Azure Machine Edukacja.
Obszar roboczy usługi Azure Machine Learning. Jeśli go nie masz, wykonaj kroki opisane w artykule How to manage workspaces (Jak zarządzać obszarami roboczymi ), aby je utworzyć.
Aby wykonać następujące zadania, upewnij się, że masz te uprawnienia w obszarze roboczym:
- Aby utworzyć i zarządzać punktami końcowymi i wdrożeniami wsadowymi: użyj roli właściciela, roli współautora lub roli niestandardowej zezwalającej na Microsoft.MachineLearningServices/workspaces/batchEndpoints/*usługę .
- Aby utworzyć wdrożenia usługi ARM w grupie zasobów obszaru roboczego: użyj roli właściciela, roli współautora lub roli niestandardowej zezwalającej Microsoft.Resources/deployments/write w grupie zasobów, w której wdrożono obszar roboczy.
Aby pracować z usługą Azure Machine Edukacja, należy zainstalować następujące oprogramowanie:
DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (bieżąca)

Interfejs wiersza polecenia platformy mlAzure i rozszerzenie usługi Azure Machine Edukacja.
```
az extension add -n ml
```
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

Zainstaluj zestaw SDK usługi Azure Machine Edukacja dla języka Python.
```
pip install azure-ai-ml
```
Jeśli planujesz używać usługi Azure Machine Edukacja Studio, nie ma żadnych dalszych wymagań.

Klonowanie repozytorium przykładów

Przykład w tym artykule jest oparty na przykładach kodu zawartych w repozytorium azureml-examples . Aby uruchomić polecenia lokalnie bez konieczności kopiowania/wklejania kodu YAML i innych plików, najpierw sklonuj repozytorium, a następnie zmień katalogi na folder:

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli/endpoints/batch/deploy-models/mnist-classifier

!git clone https://github.com/Azure/azureml-examples --depth 1
!cd azureml-examples/sdk/python/endpoints/batch/deploy-models/mnist-classifier

Aby skorzystać z tego przykładu w notesie Jupyter Notebook, w sklonowanym repozytorium otwórz notes mnist-batch.ipynb.

Przygotowywanie systemu

Nawiązywanie połączenia z obszarem roboczym

Najpierw połącz się z obszarem roboczym usługi Azure Machine Edukacja, w którym będziesz pracować.

Jeśli nie ustawiono jeszcze ustawień domyślnych dla interfejsu wiersza polecenia platformy Azure, zapisz ustawienia domyślne. Aby uniknąć wielokrotnego przekazywania wartości dla subskrypcji, obszaru roboczego, grupy zasobów i lokalizacji, uruchom następujący kod:

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

Obszar roboczy jest zasobem najwyższego poziomu dla usługi Azure Machine Learning, który udostępnia scentralizowane miejsce do pracy z wszystkimi tworzonymi podczas korzystania usługi Azure Machine Learning artefaktami. W tej sekcji połączysz się z obszarem roboczym, w którym będziesz wykonywać zadania wdrażania.

Zaimportuj wymagane biblioteki:

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

Uwaga

Klasy ModelBatchDeployment i PipelineComponentBatchDeployment zostały wprowadzone w wersji 1.7.0 zestawu SDK.

Konfigurowanie szczegółów obszaru roboczego i uzyskiwanie dojścia do obszaru roboczego:

subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

Tworzenie zasobów obliczeniowych

Punkty końcowe usługi Batch działają w klastrach obliczeniowych i obsługują zarówno klastry obliczeniowe usługi Azure Machine Edukacja (AmlCompute) jak i klastry Kubernetes. Klastry są zasobem udostępnionym, dlatego jeden klaster może hostować jedno lub wiele wdrożeń wsadowych (wraz z innymi obciążeniami, jeśli jest to konieczne).

Utwórz obliczenia o nazwie batch-cluster, jak pokazano w poniższym kodzie. Możesz dostosować je zgodnie z potrzebami i odwołać się do zasobów obliczeniowych przy użyciu polecenia azureml:<your-compute-name>.

az ml compute create -n batch-cluster --type amlcompute --min-instances 0 --max-instances 5

compute_name = "batch-cluster"
if not any(filter(lambda m: m.name == compute_name, ml_client.compute.list())):
    compute_cluster = AmlCompute(
        name=compute_name,
        description="CPU cluster compute",
        min_instances=0,
        max_instances=2,
    )
    ml_client.compute.begin_create_or_update(compute_cluster).result()

Uwaga

W tym momencie nie są naliczane opłaty za obliczenia, ponieważ klaster pozostaje w 0 węzłach do momentu wywołania punktu końcowego wsadowego i przesłania zadania oceniania wsadowego. Aby uzyskać więcej informacji na temat kosztów obliczeń, zobacz Zarządzanie kosztami i optymalizowanie kosztów dla usługi AmlCompute.

Tworzenie punktu końcowego wsadowego

Punkt końcowy wsadowy to punkt końcowy HTTPS, który klienci mogą wywoływać w celu wyzwolenia zadania oceniania wsadowego. Zadanie oceniania wsadowego to zadanie , które ocenia wiele danych wejściowych. Wdrożenie wsadowe to zestaw zasobów obliczeniowych hostujących model, który wykonuje rzeczywiste ocenianie wsadowe (lub wnioskowanie wsadowe). Jeden punkt końcowy wsadowy może mieć wiele wdrożeń wsadowych. Aby uzyskać więcej informacji na temat punktów końcowych wsadowych, zobacz Co to są punkty końcowe wsadowe?.

Napiwek

Jedno z wdrożeń wsadowych służy jako domyślne wdrożenie punktu końcowego. Po wywołaniu punktu końcowego domyślne wdrożenie wykonuje rzeczywiste ocenianie wsadowe. Aby uzyskać więcej informacji na temat punktów końcowych i wdrożeń wsadowych, zobacz batch endpoints and batch deployment (Punkty końcowe wsadowe i wdrażanie wsadowe).

Nadaj punktowi końcowego nazwę. Nazwa punktu końcowego musi być unikatowa w regionie świadczenia usługi Azure, ponieważ nazwa jest uwzględniona w identyfikatorze URI punktu końcowego. Na przykład może istnieć tylko jeden punkt końcowy wsadowy o nazwie mybatchendpoint w pliku westus2.
Umieść nazwę punktu końcowego w zmiennej, aby można było łatwo odwoływać się do niej później.
```
ENDPOINT_NAME="mnist-batch"
```
Umieść nazwę punktu końcowego w zmiennej, aby można było łatwo odwoływać się do niej później.
```
endpoint_name = "mnist-batch"
```
Nazwę punktu końcowego należy podać później podczas tworzenia wdrożenia.

Konfigurowanie punktu końcowego wsadowego

Poniższy plik YAML definiuje punkt końcowy wsadowy. Tego pliku można użyć z poleceniem interfejsu wiersza polecenia na potrzeby tworzenia punktu końcowego wsadowego.

endpoint.yml

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: mnist-batch
description: A batch endpoint for scoring images from the MNIST dataset.
tags:
  type: deep-learning

W poniższej tabeli opisano kluczowe właściwości punktu końcowego. Aby uzyskać pełny schemat YAML punktu końcowego wsadowego, zobacz Schemat YAML punktu końcowego wsadowego interfejsu wiersza polecenia (wersja 2).

Key	opis
`name`	Nazwa punktu końcowego partii. Musi być unikatowa na poziomie regionu świadczenia usługi Azure.
`description`	Opis punktu końcowego wsadowego. Ta właściwość jest opcjonalna.
`tags`	Tagi do uwzględnienia w punkcie końcowym. Ta właściwość jest opcjonalna.

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="A batch endpoint for scoring images from the MNIST dataset.",
    tags={"type": "deep-learning"},
)

W poniższej tabeli opisano kluczowe właściwości punktu końcowego. Aby uzyskać więcej informacji na temat definicji punktu końcowego wsadowego, zobacz BatchEndpoint Class (Klasa usługi BatchEndpoint).

Key	opis
`name`	Nazwa punktu końcowego partii. Musi być unikatowa na poziomie regionu świadczenia usługi Azure.
`description`	Opis punktu końcowego wsadowego. Ta właściwość jest opcjonalna.
`tags`	Tagi do uwzględnienia w punkcie końcowym. Ta właściwość jest opcjonalna.

Utwórz punkt końcowy:
Uruchom następujący kod, aby utworzyć punkt końcowy wsadowy.
```
az ml batch-endpoint create --file endpoint.yml  --name $ENDPOINT_NAME
```
```
ml_client.begin_create_or_update(endpoint).result()
```
Punkt końcowy zostanie utworzony później podczas tworzenia wdrożenia.

Tworzenie wdrożenia wsadowego

Wdrożenie modelu to zestaw zasobów wymaganych do hostowania modelu, który wykonuje rzeczywiste wnioskowanie. Do utworzenia wdrożenia modelu wsadowego potrzebne są następujące elementy:

Zarejestrowany model w obszarze roboczym
Kod oceniania modelu
Środowisko z zainstalowanymi zależnościami modelu
Wstępnie utworzone ustawienia zasobów i zasobów obliczeniowych

Zacznij od zarejestrowania modelu, który ma zostać wdrożony — modelu Torch dla popularnego problemu z rozpoznawaniem cyfr (MNIST). Wdrożenia usługi Batch mogą wdrażać tylko modele zarejestrowane w obszarze roboczym. Ten krok można pominąć, jeśli model, który chcesz wdrożyć, jest już zarejestrowany.

Napiwek

Modele są skojarzone z wdrożeniem, a nie z punktem końcowym. Oznacza to, że pojedynczy punkt końcowy może obsługiwać różne modele (lub wersje modelu) w ramach tego samego punktu końcowego, pod warunkiem, że różne modele (lub wersje modelu) są wdrażane w różnych wdrożeniach.
```
MODEL_NAME='mnist-classifier-torch'
az ml model create --name $MODEL_NAME --type "custom_model" --path "deployment-torch/model"
```
```
model_name = "mnist-classifier-torch"
model_local_path = "deployment-torch/model/"

model = ml_client.models.create_or_update(
    Model(
        name=model_name,
        path=model_local_path,
        type=AssetTypes.CUSTOM_MODEL,
        tags={"task": "classification", "framework": "torch"},
    )
)
```
1. Przejdź do karty Modele w menu bocznym.
2. Wybierz pozycję Zarejestruj>z plików lokalnych.
3. W kreatorze pozostaw opcję Typ modelu jako Nieokreślony typ.
4. Wybierz pozycję Przeglądaj>folder> Wybierz folder>deployment-torch/model Dalej.
5. Skonfiguruj nazwę modelu: mnist-classifier-torch. Pozostałe pola można pozostawić tak, jak są.
6. Wybierz pozycję Zarejestruj.

Teraz nadszedł czas, aby utworzyć skrypt oceniania. Wdrożenia wsadowe wymagają skryptu oceniania wskazującego sposób wykonywania danego modelu i sposób przetwarzania danych wejściowych. Punkty końcowe usługi Batch obsługują skrypty utworzone w języku Python. W tym przypadku wdrożysz model, który odczytuje pliki obrazów reprezentujące cyfry i dane wyjściowe odpowiadającej mu cyfry. Skrypt oceniania wygląda następująco:

Uwaga

W przypadku modeli MLflow usługa Azure Machine Edukacja automatycznie generuje skrypt oceniania, więc nie musisz go podawać. Jeśli model jest modelem MLflow, możesz pominąć ten krok. Aby uzyskać więcej informacji na temat sposobu pracy punktów końcowych wsadowych z modelami MLflow, zobacz artykuł Using MLflow models in batch deployments (Używanie modeli MLflow we wdrożeniach wsadowych).

Ostrzeżenie

Jeśli wdrażasz model zautomatyzowanego uczenia maszynowego (AutoML) w punkcie końcowym wsadowym, pamiętaj, że skrypt oceniania, który zapewnia rozwiązanie AutoML, działa tylko dla punktów końcowych online i nie jest przeznaczony do wykonywania wsadowego. Aby uzyskać informacje na temat tworzenia skryptu oceniania dla wdrożenia wsadowego, zobacz Tworzenie skryptów oceniania dla wdrożeń wsadowych.

deployment-torch/code/batch_driver.py

import os
import pandas as pd
import torch
import torchvision
import glob
from os.path import basename
from mnist_classifier import MnistClassifier
from typing import List


def init():
    global model
    global device

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    # It is the path to the model folder
    model_path = os.environ["AZUREML_MODEL_DIR"]
    model_file = glob.glob(f"{model_path}/*/*.pt")[-1]

    model = MnistClassifier()
    model.load_state_dict(torch.load(model_file))
    model.eval()

    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")


def run(mini_batch: List[str]) -> pd.DataFrame:
    print(f"Executing run method over batch of {len(mini_batch)} files.")

    results = []
    with torch.no_grad():
        for image_path in mini_batch:
            image_data = torchvision.io.read_image(image_path).float()
            batch_data = image_data.expand(1, -1, -1, -1)
            input = batch_data.to(device)

            # perform inference
            predict_logits = model(input)

            # Compute probabilities, classes and labels
            predictions = torch.nn.Softmax(dim=-1)(predict_logits)
            predicted_prob, predicted_class = torch.max(predictions, axis=-1)

            results.append(
                {
                    "file": basename(image_path),
                    "class": predicted_class.numpy()[0],
                    "probability": predicted_prob.numpy()[0],
                }
            )

    return pd.DataFrame(results)

Utwórz środowisko, w którym zostanie uruchomione wdrożenie wsadowe. Środowisko powinno zawierać pakiety azureml-core i azureml-dataset-runtime[fuse], które są wymagane przez punkty końcowe wsadowe, a także wszelkie zależności wymagane przez kod do uruchomienia. W takim przypadku zależności zostały przechwycone w conda.yaml pliku:

deployment-torch/environment/conda.yaml
```
name: mnist-env
channels:
  - conda-forge
dependencies:
  - python=3.8.5
  - pip<22.0
  - pip:
    - torch==1.13.0
    - torchvision==0.14.0
    - pytorch-lightning
    - pandas
    - azureml-core
    - azureml-dataset-runtime[fuse]
```
Ważne

Pakiety azureml-core i azureml-dataset-runtime[fuse] są wymagane przez wdrożenia wsadowe i powinny być uwzględnione w zależnościach środowiska.

Określ środowisko w następujący sposób:
Definicja środowiska zostanie uwzględniona w definicji wdrożenia jako środowisko anonimowe. W ramach wdrożenia zobaczysz następujące wiersze:
```
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
Uzyskaj odwołanie do środowiska:
```
env = Environment(
    name="batch-torch-py38",
    conda_file="deployment-torch/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```
W usłudze Azure Machine Edukacja Studio wykonaj następujące kroki:
1. Przejdź do karty Środowiska w menu bocznym.
2. Wybierz kartę Niestandardowe środowiska>Utwórz.
3. Wprowadź nazwę środowiska, w tym przypadku torch-batch-env.
4. W obszarze Wybierz źródło środowiska wybierz pozycję Użyj istniejącego obrazu platformy Docker z opcjonalnym plikiem conda.
5. W polu Ścieżka obrazu rejestru kontenerów wprowadź wartość mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04.
6. Wybierz przycisk Dalej , aby przejść do sekcji "Dostosuj".
7. Skopiuj zawartość pliku deployment-torch/environment/conda.yaml z repozytorium GitHub do portalu.
8. Wybierz przycisk Dalej , dopóki nie zostanie wyświetlona strona "Przeglądanie".
9. Wybierz pozycję Utwórz i poczekaj, aż środowisko będzie gotowe do użycia.
Ostrzeżenie

Nadzorowane środowiska nie są obsługiwane we wdrożeniach wsadowych. Musisz określić własne środowisko. W celu uproszczenia procesu zawsze można użyć obrazu podstawowego środowiska wyselekcjonowanego.

Tworzenie definicji wdrożenia

torch/deployment.yml wdrożenia

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-torch-dpl
description: A deployment using Torch to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model:
  name: mnist-classifier-torch
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 30
  error_threshold: -1
  logging_level: info

W poniższej tabeli opisano kluczowe właściwości wdrożenia wsadowego. Aby zapoznać się ze schematem YAML pełnego wdrożenia wsadowego, zobacz Schemat YAML wdrożenia wsadowego (CLI, v2).

Key	opis
`name`	Nazwa wdrożenia.
`endpoint_name`	Nazwa punktu końcowego do utworzenia wdrożenia w obszarze.
`model`	Model, który ma być używany do oceniania wsadowego. W przykładzie zdefiniowano wbudowany model przy użyciu polecenia `path`. Ta definicja umożliwia automatyczne przekazywanie i zarejestrowanie plików modelu przy użyciu automatycznie wygenerowanej nazwy i wersji. Aby uzyskać więcej opcji, zobacz schemat modelu. Najlepszym rozwiązaniem dla scenariuszy produkcyjnych jest utworzenie modelu oddzielnie i odwołanie do niego w tym miejscu. Aby odwołać się do istniejącego modelu, użyj `azureml:<model-name>:<model-version>` składni .
`code_configuration.code`	Katalog lokalny zawierający cały kod źródłowy języka Python do oceny modelu.
`code_configuration.scoring_script`	Plik języka Python w `code_configuration.code` katalogu . Ten plik musi mieć `init()` funkcję i `run()` funkcję. `init()` Użyj funkcji dla każdego kosztownego lub wspólnego przygotowania (na przykład do załadowania modelu w pamięci). `init()` zostanie wywołana tylko raz na początku procesu. Służy `run(mini_batch)` do oceniania każdego wpisu; wartość `mini_batch` jest listą ścieżek plików. Funkcja `run()` powinna zwrócić ramkę danych biblioteki pandas lub tablicę. Każdy zwrócony element wskazuje jeden pomyślny przebieg elementu wejściowego w elemecie `mini_batch`. Aby uzyskać więcej informacji na temat tworzenia skryptu oceniania, zobacz Opis skryptu oceniania.
`environment`	Środowisko do oceny modelu. W przykładzie zdefiniowano wbudowane środowisko przy użyciu elementów `conda_file` i `image`. Zależności `conda_file` zostaną zainstalowane na podstawie .`image` Środowisko zostanie automatycznie zarejestrowane przy użyciu automatycznie wygenerowanej nazwy i wersji. Aby uzyskać więcej opcji, zobacz Schemat środowiska. Najlepszym rozwiązaniem dla scenariuszy produkcyjnych jest utworzenie środowiska oddzielnie i odwołanie do niego w tym miejscu. Aby odwołać się do istniejącego środowiska, użyj `azureml:<environment-name>:<environment-version>` składni .
`compute`	Obliczenia do uruchamiania oceniania wsadowego. W przykładzie użyto utworzonego `batch-cluster` na początku elementu i odwołuje się do niego przy użyciu `azureml:<compute-name>` składni .
`resources.instance_count`	Liczba wystąpień, które mają być używane dla każdego zadania oceniania wsadowego.
`settings.max_concurrency_per_instance`	[Opcjonalnie] Maksymalna liczba przebiegów równoległych `scoring_script` na wystąpienie.
`settings.mini_batch_size`	[Opcjonalnie] Liczba plików, które `scoring_script` mogą przetwarzać w jednym `run()` wywołaniu.
`settings.output_action`	[Opcjonalnie] Sposób organizowania danych wyjściowych w pliku wyjściowym. `append_row` Scali wszystkie `run()` zwrócone wyniki wyjściowe w jeden plik o nazwie `output_file_name`. `summary_only` nie scali wyników wyjściowych i obliczy tylko `error_threshold`wartość .
`settings.output_file_name`	[Opcjonalnie] Nazwa pliku wyjściowego oceniania wsadowego dla .`append_rowoutput_action`
`settings.retry_settings.max_retries`	[Opcjonalnie] Liczba prób maksymalnej liczby nieudanych `scoring_scriptrun()`prób.
`settings.retry_settings.timeout`	[Opcjonalnie] Limit czasu w sekundach dla oceny `scoring_scriptrun()` minisadowej.
`settings.error_threshold`	[Opcjonalnie] Liczba błędów oceniania pliku wejściowego, które powinny być ignorowane. Jeśli liczba błędów dla całego danych wejściowych przekroczy tę wartość, zadanie oceniania wsadowego zostanie zakończone. W przykładzie użyto `-1`metody , która wskazuje, że dowolna liczba niepowodzeń jest dozwolona bez kończenia zadania oceniania wsadowego.
`settings.logging_level`	[Opcjonalnie] Czasownik dziennika. Wartości zwiększające szczegółowość to: OSTRZEŻENIE, INFORMACJE i DEBUGOWANIE.
`settings.environment_variables`	[Opcjonalnie] Słownik par nazwa-wartość zmiennej środowiskowej do ustawienia dla każdego zadania oceniania wsadowego.

deployment = ModelBatchDeployment(
    name="mnist-torch-dpl",
    description="A deployment using Torch to solve the MNIST classification dataset.",
    endpoint_name=endpoint_name,
    model=model,
    code_configuration=CodeConfiguration(
        code="deployment-torch/code/", scoring_script="batch_driver.py"
    ),
    environment=env,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        instance_count=2,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=30),
        logging_level="info",
    ),
)

Klasa BatchDeployment umożliwia skonfigurowanie następujących kluczowych właściwości wdrożenia wsadowego:

Key	opis
`name`	Nazwa wdrożenia.
`endpoint_name`	Nazwa punktu końcowego do utworzenia wdrożenia w obszarze.
`model`	Model do użycia na potrzeby wdrożenia. Ta wartość może być odwołaniem do istniejącego modelu w wersji w obszarze roboczym lub specyfikacji wbudowanego modelu.
`environment`	Środowisko do użycia na potrzeby wdrożenia. Ta wartość może być odwołaniem do istniejącego środowiska w wersji w obszarze roboczym lub specyfikacji środowiska wbudowanego (opcjonalnie dla modeli MLflow).
`code_configuration`	Konfiguracja dotycząca sposobu uruchamiania wnioskowania dla modelu (opcjonalnie dla modeli MLflow).
`code_configuration.code`	Ścieżka do katalogu kodu źródłowego na potrzeby oceniania modelu.
`code_configuration.scoring_script`	Ścieżka względna do pliku oceniania w katalogu kodu źródłowego.
`compute`	Nazwa docelowego obiektu obliczeniowego, na którym mają zostać wykonane zadania oceniania wsadowego.
`instance_count`	Liczba węzłów do użycia dla każdego zadania oceniania wsadowego.
`settings`	Konfiguracja wnioskowania wdrożenia modelu.
`settings.max_concurrency_per_instance`	Maksymalna liczba przebiegów równoległych `scoring_script` na wystąpienie.
`settings.mini_batch_size`	Liczba plików, które `code_configuration.scoring_script` mogą przetwarzać w jednym `run`wywołaniu ().
`settings.retry_settings`	Ustawienia ponawiania prób dla oceniania każdej minisadowej partii.
`settings.retry_settingsmax_retries`	Maksymalna liczba ponownych prób dla minisadowej partii zakończonych niepowodzeniem lub przekroczono limit czasu (wartość domyślna to 3).
`settings.retry_settingstimeout`	Limit czasu w sekundach na ocenianie minisadowej partii (wartość domyślna to 30).
`settings.output_action`	Sposób organizowania danych wyjściowych w pliku wyjściowym. Dozwolone wartości to `append_row` lub `summary_only`. Wartość domyślna to `append_row`.
`settings.logging_level`	Poziom szczegółowości dziennika. Dozwolone wartości to `warning`, , `debuginfo`. Wartość domyślna to `info`.
`settings.environment_variables`	Słownik par nazwa-wartość zmiennej środowiskowej do ustawienia dla każdego zadania oceniania wsadowego.

W studio wykonaj następujące kroki:

Przejdź do karty Punkty końcowe w menu bocznym.
Wybierz kartę Punkty końcowe>usługi Batch Utwórz.
Nadaj punktowi końcowemu nazwę, w tym przypadku mnist-batch. Pozostałe pola można skonfigurować lub pozostawić je puste.
Wybierz pozycję Dalej , aby przejść do sekcji "Model".
Wybierz model mnist-classifier-torch.
Wybierz przycisk Dalej , aby przejść do strony "Wdrożenie".
Nadaj wdrożeniu nazwę.
W obszarze Akcja Dane wyjściowe upewnij się, że wybrano pozycję Dołącz wiersz.
W polu Nazwa pliku wyjściowego upewnij się, że plik wyjściowy oceniania wsadowego jest potrzebny. Wartość domyślna to predictions.csv.
W przypadku rozmiaru minisadowego dostosuj rozmiar plików, które zostaną uwzględnione w każdej minisadowej partii. Ten rozmiar będzie kontrolować ilość danych, które skrypt oceniania otrzymuje na partię.
W przypadku limitu czasu oceniania (w sekundach) upewnij się, że dajesz wystarczająco dużo czasu, aby wdrożenie oceniało daną partię plików. Jeśli zwiększysz liczbę plików, zwykle trzeba zwiększyć wartość limitu czasu. Droższe modele (takie jak te oparte na uczeniu głębokim) mogą wymagać wysokich wartości w tym polu.
W przypadku opcji Maksymalna współbieżność na wystąpienie skonfiguruj liczbę funkcji wykonawczych, które mają być dla każdego wystąpienia obliczeniowego, które otrzymujesz we wdrożeniu. Większa liczba gwarantuje wyższy stopień równoległości, ale zwiększa również wykorzystanie pamięci w wystąpieniu obliczeniowym. Dostroj tę wartość w całości przy użyciu rozmiaru partii Mini.
Po zakończeniu wybierz przycisk Dalej , aby przejść do strony "Kod i środowisko".
W obszarze "Wybierz skrypt oceniania na potrzeby wnioskowania", przejdź do znajdowania i wybierania pliku skryptu oceniania deployment-torch/code/batch_driver.py.
W sekcji "Wybierz środowisko" wybierz utworzone wcześniej środowisko torch-batch-env.
Wybierz pozycję Dalej , aby przejść do strony "Obliczenia".
Wybierz klaster obliczeniowy utworzony w poprzednim kroku.

Ostrzeżenie

Klaster Usługi Azure Kubernetes jest obsługiwany we wdrożeniach wsadowych, ale tylko w przypadku tworzenia przy użyciu interfejsu wiersza polecenia usługi Azure Machine Edukacja lub zestawu SDK języka Python.
W polu Liczba wystąpień wprowadź liczbę wystąpień obliczeniowych, które mają być przeznaczone dla wdrożenia. W tym przypadku użyj wartości 2.
Wybierz Dalej.

Utwórz wdrożenie:
Uruchom następujący kod, aby utworzyć wdrożenie wsadowe w punkcie końcowym wsadowym i ustawić je jako domyślne wdrożenie.
```
az ml batch-deployment create --file deployment-torch/deployment.yml --endpoint-name $ENDPOINT_NAME --set-default
```
Napiwek

Parametr --set-default ustawia nowo utworzone wdrożenie jako domyślne wdrożenie punktu końcowego. Jest to wygodny sposób tworzenia nowego domyślnego wdrożenia punktu końcowego, szczególnie w przypadku pierwszego utworzenia wdrożenia. Najlepszym rozwiązaniem dla scenariuszy produkcyjnych może być utworzenie nowego wdrożenia bez ustawiania go jako domyślnego. Sprawdź, czy wdrożenie działa zgodnie z oczekiwaniami, a następnie zaktualizuj domyślne wdrożenie później. Aby uzyskać więcej informacji na temat implementowania tego procesu, zobacz sekcję Wdrażanie nowego modelu .
Za pomocą utworzonego MLClient wcześniej polecenia utwórz wdrożenie w obszarze roboczym. To polecenie uruchamia tworzenie wdrożenia i zwraca odpowiedź potwierdzenia, gdy tworzenie wdrożenia będzie kontynuowane.
```
ml_client.begin_create_or_update(deployment).result()
```
Po zakończeniu wdrażania ustaw nowe wdrożenie jako domyślne wdrożenie w punkcie końcowym:
```
endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
W kreatorze wybierz pozycję Utwórz , aby rozpocząć proces wdrażania.
Sprawdź szczegóły punktu końcowego i wdrożenia wsadowego.
Użyj polecenia show , aby sprawdzić szczegóły punktu końcowego i wdrożenia. Aby sprawdzić wdrożenie wsadowe, uruchom następujący kod:
```
DEPLOYMENT_NAME="mnist-torch-dpl"
az ml batch-deployment show --name $DEPLOYMENT_NAME --endpoint-name $ENDPOINT_NAME
```
Aby sprawdzić wdrożenie wsadowe, uruchom następujący kod:
```
ml_client.batch_deployments.get(name=deployment.name, endpoint_name=endpoint.name)
```
Po utworzeniu punktu końcowego wsadowego zostanie otwarta strona szczegółów punktu końcowego. Tę stronę można również znaleźć, wykonując następujące kroki:
1. Przejdź do karty Punkty końcowe w menu bocznym.
2. Wybierz kartę Punkty końcowe usługi Batch.
3. Wybierz punkt końcowy partii, który chcesz wyświetlić.
4. Strona Szczegóły punktu końcowego zawiera szczegóły punktu końcowego wraz ze wszystkimi wdrożeniami dostępnymi w punkcie końcowym.

Uruchamianie punktów końcowych wsadowych i uzyskiwanie dostępu do wyników

Wywoływanie punktu końcowego wsadowego wyzwala zadanie oceniania wsadowego. Zadanie name jest zwracane z odpowiedzi wywołania i może służyć do śledzenia postępu oceniania wsadowego. Podczas uruchamiania modeli oceniania w punktach końcowych wsadowych należy określić ścieżkę do danych wejściowych, aby punkty końcowe mogły znaleźć dane, które chcesz ocenić. W poniższym przykładzie pokazano, jak uruchomić nowe zadanie względem przykładowych danych zestawu danych MNIST przechowywanego na koncie usługi Azure Storage.

Punkt końcowy usługi Batch można uruchomić i wywołać przy użyciu interfejsu wiersza polecenia platformy Azure, zestawu SDK usługi Azure Machine Edukacja lub punktów końcowych REST. Aby uzyskać więcej informacji na temat tych opcji, zobacz Tworzenie zadań i danych wejściowych dla punktów końcowych wsadowych.

Uwaga

Jak działa równoległe przetwarzanie?

Wdrożenia wsadowe dystrybuują pracę na poziomie pliku, co oznacza, że folder zawierający 100 plików z minisadami 10 plików spowoduje wygenerowanie 10 partii 10 plików. Zwróć uwagę, że dzieje się tak niezależnie od rozmiaru zaangażowanych plików. Jeśli pliki są zbyt duże do przetworzenia w dużych minisadach, sugerujemy podzielenie plików na mniejsze pliki w celu osiągnięcia wyższego poziomu równoległości lub zmniejszenie liczby plików na minisadę. Obecnie wdrożenia wsadowe nie mogą uwzględniać niesymetryczności w dystrybucji rozmiaru pliku.

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --input-type uri_folder --query name -o tsv)

Napiwek

Jaka jest różnica między inputs i input podczas wywoływania punktu końcowego?

Ogólnie rzecz biorąc, można użyć słownika inputs = {} z invoke metodą , aby podać dowolną liczbę wymaganych danych wejściowych do punktu końcowego partii zawierającego wdrożenie modelu lub wdrożenie potoku.

W przypadku wdrożenia modelu można użyć input jako krótszego sposobu określania lokalizacji danych wejściowych dla wdrożenia, ponieważ wdrożenie modelu zawsze przyjmuje tylko jedno dane wejściowe.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment.name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
)

Przejdź do karty Punkty końcowe w menu bocznym.
Wybierz kartę Punkty końcowe usługi Batch.
Wybierz właśnie utworzony punkt końcowy partii.
Wybierz pozycję Utwórz zadanie.
W obszarze Wdrożenie wybierz wdrożenie do wykonania.
Wybierz przycisk Dalej , aby przejść do strony "Wybierz źródło danych".
W polu "Typ źródła danych" wybierz pozycję Magazyn danych.
W obszarze "Magazyn danych" wybierz pozycję workspaceblobstore z menu rozwijanego.
W polu "Ścieżka" wprowadź pełny adres URL https://azuremlexampledata.blob.core.windows.net/data/mnist/sample.

Napiwek

Ta ścieżka działa tylko dlatego, że dana ścieżka ma włączony dostęp publiczny. Ogólnie rzecz biorąc, należy zarejestrować źródło danych jako magazyn danych. Aby uzyskać szczegółowe informacje, zobacz Uzyskiwanie dostępu do danych z zadań punktów końcowych wsadowych.
Wybierz Dalej.
Wybierz pozycję Utwórz , aby uruchomić zadanie.

Punkty końcowe usługi Batch obsługują odczytywanie plików lub folderów znajdujących się w różnych lokalizacjach. Aby dowiedzieć się więcej o obsługiwanych typach i sposobach ich określania, zobacz Uzyskiwanie dostępu do danych z zadań punktów końcowych wsadowych.

Monitorowanie postępu wykonywania zadania wsadowego

Zadania oceniania wsadowego zwykle zajmują trochę czasu, aby przetworzyć cały zestaw danych wejściowych.

Poniższy kod sprawdza stan zadania i generuje link do programu Azure Machine Edukacja Studio, aby uzyskać więcej szczegółów.

az ml job show -n $JOB_NAME --web

Poniższy kod sprawdza stan zadania i generuje link do programu Azure Machine Edukacja Studio, aby uzyskać więcej szczegółów.

ml_client.jobs.get(job.name)

Sprawdzanie wyników oceniania wsadowego

Dane wyjściowe zadania są przechowywane w magazynie w chmurze w domyślnym magazynie obiektów blob obszaru roboczego lub określonym magazynie. Aby dowiedzieć się, jak zmienić ustawienia domyślne, zobacz Konfigurowanie lokalizacji wyjściowej. Poniższe kroki umożliwiają wyświetlenie wyników oceniania w Eksplorator usługi Azure Storage po zakończeniu zadania:

Uruchom następujący kod, aby otworzyć zadanie oceniania wsadowego w usłudze Azure Machine Edukacja Studio. Link do programu Job Studio jest również uwzględniony w odpowiedzi elementu invoke, jako wartość interactionEndpoints.Studio.endpoint.
```
az ml job show -n $JOB_NAME --web
```
Na wykresie zadania wybierz batchscoring krok.
Wybierz kartę Dane wyjściowe i dzienniki , a następnie wybierz pozycję Pokaż dane wyjściowe.
W obszarze Dane wyjściowe wybierz ikonę, aby otworzyć Eksplorator usługi Storage.

Wyniki oceniania w Eksplorator usługi Storage są podobne do następującej przykładowej strony:

Konfigurowanie lokalizacji wyjściowej

Domyślnie wyniki oceniania wsadowego są przechowywane w domyślnym magazynie obiektów blob obszaru roboczego w folderze o nazwie według nazwy zadania (identyfikator GUID generowany przez system). Możesz skonfigurować miejsce przechowywania danych wyjściowych oceniania podczas wywoływania punktu końcowego wsadowego.

Służy output-path do konfigurowania dowolnego folderu w zarejestrowanym magazynie danych w usłudze Azure Machine Edukacja. Składnia elementu --output-path jest taka sama jak --input w przypadku określania folderu , azureml://datastores/<datastore-name>/paths/<path-on-datastore>/czyli . Użyj --set output_file_name=<your-file-name> polecenia , aby skonfigurować nową nazwę pliku wyjściowego.

OUTPUT_FILE_NAME=predictions_`echo $RANDOM`.csv
OUTPUT_PATH="azureml://datastores/workspaceblobstore/paths/$ENDPOINT_NAME"

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --output-path $OUTPUT_PATH --set output_file_name=$OUTPUT_FILE_NAME --query name -o tsv)

Służy params_override do konfigurowania dowolnego folderu w magazynie danych zarejestrowanych w usłudze Azure Machine Edukacja. Tylko zarejestrowane magazyny danych są obsługiwane jako ścieżki wyjściowe. W tym przykładzie użyjesz domyślnego magazynu danych:

batch_ds = ml_client.datastores.get_default()

Po zidentyfikowaniu magazynu danych, którego chcesz użyć, skonfiguruj dane wyjściowe w następujący sposób:

filename = f"predictions-{random.randint(0,99999)}.csv"

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
    params_override=[
        {"output_dataset.datastore_id": f"azureml:{batch_ds.id}"},
        {"output_dataset.path": f"/{endpoint_name}/"},
        {"output_file_name": filename},
    ],
)

Ostrzeżenie

Musisz użyć unikatowej lokalizacji wyjściowej. Jeśli plik wyjściowy istnieje, zadanie oceniania wsadowego zakończy się niepowodzeniem.

Ważne

W przeciwieństwie do danych wejściowych dane wyjściowe mogą być przechowywane tylko w usłudze Azure Machine Edukacja magazynach danych uruchamianych na kontach usługi Blob Storage.

Zastępowanie konfiguracji wdrożenia dla każdego zadania

Podczas wywoływania punktu końcowego wsadowego niektóre ustawienia można zastąpić, aby jak najlepiej wykorzystać zasoby obliczeniowe i zwiększyć wydajność. Następujące ustawienia można skonfigurować dla poszczególnych zadań:

Liczba wystąpień: użyj tego ustawienia, aby zastąpić liczbę wystąpień do żądania z klastra obliczeniowego. Na przykład w przypadku większej ilości danych wejściowych możesz użyć większej liczby wystąpień, aby przyspieszyć zakończenie oceniania wsadowego.
Rozmiar minisadów: użyj tego ustawienia, aby zastąpić liczbę plików do uwzględnienia w każdej minisadowej partii. Liczba minisadów jest określana przez łączną liczbę plików wejściowych i rozmiar mini-partii. Mniejszy rozmiar mini-partii generuje więcej minisadów. Minisady mogą być uruchamiane równolegle, ale mogą istnieć dodatkowe obciążenia związane z planowaniem i wywołaniem.
Inne ustawienia, takie jak maksymalna liczba ponownych prób, przekroczenie limitu czasu i próg błędu, można zastąpić. Te ustawienia mogą mieć wpływ na pełny czas oceniania wsadowego dla różnych obciążeń.

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --mini-batch-size 20 --instance-count 5 --query name -o tsv)

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/"
    ),
    params_override=[{"mini_batch_size": "20"}, {"compute.instance_count": "5"}],
)

Dodawanie wdrożeń do punktu końcowego

Po utworzeniu punktu końcowego wsadowego z wdrożeniem możesz nadal uściślić model i dodawać nowe wdrożenia. Punkty końcowe usługi Batch będą nadal obsługiwać wdrożenie domyślne podczas tworzenia i wdrażania nowych modeli w ramach tego samego punktu końcowego. Wdrożenia nie mają wpływu na siebie.

W tym przykładzie dodasz drugie wdrożenie korzystające z modelu utworzonego za pomocą interfejsu Keras i TensorFlow w celu rozwiązania tego samego problemu MNIST.

Dodawanie drugiego wdrożenia

Utwórz środowisko, w którym zostanie uruchomione wdrożenie wsadowe. Uwzględnij w środowisku dowolną zależność wymaganą przez kod do uruchomienia. Należy również dodać bibliotekę azureml-core, ponieważ jest ona wymagana do pracy wdrożeń wsadowych. Poniższa definicja środowiska zawiera biblioteki wymagane do uruchomienia modelu za pomocą bibliotek TensorFlow.
Definicja środowiska jest uwzględniana w samej definicji wdrożenia jako środowisko anonimowe.
```
environment:
  name: batch-tensorflow-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
Uzyskaj odwołanie do środowiska:
```
env = Environment(
    name="batch-tensorflow-py38",
    conda_file="deployment-keras/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```
1. Przejdź do karty Środowiska w menu bocznym.
2. Wybierz kartę Niestandardowe środowiska>Utwórz.
3. Wprowadź nazwę środowiska, w tym przypadku keras-batch-env.
4. W obszarze Wybierz źródło środowiska wybierz pozycję Użyj istniejącego obrazu platformy Docker z opcjonalnym plikiem conda.
5. W polu Ścieżka obrazu rejestru kontenerów wprowadź wartość mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04.
6. Wybierz przycisk Dalej , aby przejść do sekcji "Dostosuj".
7. Skopiuj zawartość pliku deployment-keras/environment/conda.yaml z repozytorium GitHub do portalu.
8. Wybierz przycisk Dalej , dopóki nie zostanie wyświetlona strona "Przeglądanie".
9. Wybierz pozycję Utwórz i poczekaj, aż środowisko będzie gotowe do użycia.
Użyty plik conda wygląda następująco:

deployment-keras/environment/conda.yaml
```
name: tensorflow-env
channels:
  - conda-forge
dependencies:
  - python=3.8.5
  - pip
  - pip:
    - pandas
    - tensorflow
    - pillow
    - azureml-core
    - azureml-dataset-runtime[fuse]
```

Utwórz skrypt oceniania dla modelu:

deployment-keras/code/batch_driver.py

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from typing import List
from os.path import basename
from PIL import Image
from tensorflow.keras.models import load_model


def init():
    global model

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)


def run(mini_batch: List[str]) -> pd.DataFrame:
    print(f"Executing run method over batch of {len(mini_batch)} files.")

    results = []
    for image_path in mini_batch:
        data = Image.open(image_path)
        data = np.array(data)
        data_batch = tf.expand_dims(data, axis=0)

        # perform inference
        pred = model.predict(data_batch)

        # Compute probabilities, classes and labels
        pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
        pred_class = tf.math.argmax(pred, axis=-1).numpy()

        results.append(
            {
                "file": basename(image_path),
                "class": pred_class[0],
                "probability": pred_prob,
            }
        )

    return pd.DataFrame(results)

Tworzenie definicji wdrożenia
deployment-keras/deployment.yml
```
$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-keras-dpl
description: A deployment using Keras with TensorFlow to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model: 
  name: mnist-classifier-keras
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-tensorflow-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
```
```
deployment_keras = ModelBatchDeployment(
    name="mnist-keras-dpl",
    description="A deployment using Keras to solve the MNIST classification dataset.",
    endpoint_name=endpoint_name,
    model=model,
    code_configuration=CodeConfiguration(
        code="deployment-keras/code/", scoring_script="batch_driver.py"
    ),
    environment=env,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        instance_count=2,
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=30),
        logging_level="info",
    ),
)
```
1. Przejdź do karty Punkty końcowe w menu bocznym.
2. Wybierz kartę Punkty końcowe usługi Batch.
3. Wybierz istniejący punkt końcowy partii, w którym chcesz dodać wdrożenie.
4. Wybierz pozycję Dodaj wdrożenie.
5. Wybierz pozycję Dalej , aby przejść do strony "Model".
6. Z listy modelu wybierz model mnist i wybierz pozycję Dalej.
7. Na stronie konfiguracja wdrożenia nadaj wdrożeniu nazwę.
8. Cofnij wybór opcji: Ustaw to nowe wdrożenie jako domyślne dla zadań wsadowych.
9. W obszarze Akcja Dane wyjściowe upewnij się, że wybrano pozycję Dołącz wiersz.
10. W polu Nazwa pliku wyjściowego upewnij się, że plik wyjściowy oceniania wsadowego jest potrzebny. Wartość domyślna to predictions.csv.
11. W przypadku rozmiaru minisadowego dostosuj rozmiar plików, które zostaną uwzględnione w każdej minisadowej partii. Spowoduje to kontrolowanie ilości danych odbieranych przez skrypt oceniania dla każdej partii.
12. W przypadku limitu czasu oceniania (w sekundach) upewnij się, że dajesz wystarczająco dużo czasu, aby wdrożenie oceniało daną partię plików. Jeśli zwiększysz liczbę plików, zwykle trzeba zwiększyć wartość limitu czasu. Droższe modele (takie jak te oparte na uczeniu głębokim) mogą wymagać wysokich wartości w tym polu.
13. W przypadku opcji Maksymalna współbieżność na wystąpienie skonfiguruj liczbę funkcji wykonawczych, które mają być dla każdego wystąpienia obliczeniowego, które otrzymujesz we wdrożeniu. Większa liczba gwarantuje wyższy stopień równoległości, ale zwiększa również wykorzystanie pamięci w wystąpieniu obliczeniowym. Dostroj tę wartość w całości przy użyciu rozmiaru partii Mini.
14. Wybierz przycisk Dalej , aby przejść do strony "Kod i środowisko".
15. W obszarze Wybierz skrypt oceniania na potrzeby wnioskowania przejdź do pliku skryptu oceniania deployment-keras/code/batch_driver.py.
16. W obszarze Wybierz środowisko wybierz środowisko utworzone w poprzednim kroku.
17. Wybierz Dalej.
18. Na stronie Obliczenia wybierz klaster obliczeniowy utworzony w poprzednim kroku.
19. W polu Liczba wystąpień wprowadź liczbę wystąpień obliczeniowych, które mają być przeznaczone dla wdrożenia. W tym przypadku użyj wartości 2.
20. Wybierz Dalej.
Utwórz wdrożenie:
Uruchom następujący kod, aby utworzyć wdrożenie wsadowe w punkcie końcowym wsadowym i ustawić je jako domyślne wdrożenie.
```
az ml batch-deployment create --file deployment-keras/deployment.yml --endpoint-name $ENDPOINT_NAME
```
Napiwek

Brak parametru --set-default w tym przypadku. Najlepszym rozwiązaniem dla scenariuszy produkcyjnych jest utworzenie nowego wdrożenia bez ustawiania go jako domyślnego. Następnie zweryfikuj je i zaktualizuj wdrożenie domyślne później.
Za pomocą utworzonego MLClient wcześniej polecenia utwórz wdrożenie w obszarze roboczym. To polecenie uruchamia tworzenie wdrożenia i zwraca odpowiedź potwierdzenia, gdy tworzenie wdrożenia będzie kontynuowane.
```
ml_client.begin_create_or_update(deployment_keras).result()
```
W kreatorze wybierz pozycję Utwórz , aby rozpocząć proces wdrażania.

Testowanie wdrożenia wsadowego innego niż domyślne

Aby przetestować nowe wdrożenie inne niż domyślne, musisz znać nazwę wdrożenia, które chcesz uruchomić.

DEPLOYMENT_NAME="mnist-keras-dpl"
JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --deployment-name $DEPLOYMENT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --input-type uri_folder --query name -o tsv)

Powiadomienie --deployment-name służy do określania wdrożenia do wykonania. Ten parametr umożliwia invoke wdrożenie inne niż domyślne bez aktualizowania domyślnego wdrożenia punktu końcowego wsadowego.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment_keras.name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
)

Powiadomienie deployment_name służy do określania wdrożenia do wykonania. Ten parametr umożliwia invoke wdrożenie inne niż domyślne bez aktualizowania domyślnego wdrożenia punktu końcowego wsadowego.

Aktualizowanie domyślnego wdrożenia wsadowego

Chociaż można wywołać określone wdrożenie wewnątrz punktu końcowego, zazwyczaj należy wywołać sam punkt końcowy i pozwolić punktowi końcowemu zdecydować, którego wdrożenia użyć — domyślne wdrożenie. Możesz zmienić domyślne wdrożenie (a w związku z tym zmienić model obsługujący wdrożenie) bez zmiany umowy z użytkownikiem wywołującym punkt końcowy. Użyj następującego kodu, aby zaktualizować wdrożenie domyślne:

az ml batch-endpoint update --name $ENDPOINT_NAME --set defaults.deployment_name=$DEPLOYMENT_NAME

endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment_keras.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()

Usuwanie punktu końcowego wsadowego i wdrożenia

Jeśli nie będziesz używać starego wdrożenia wsadowego, usuń je, uruchamiając następujący kod. --yes służy do potwierdzania usunięcia.

az ml batch-deployment delete --name mnist-torch-dpl --endpoint-name $ENDPOINT_NAME --yes

Uruchom następujący kod, aby usunąć punkt końcowy wsadowy i wszystkie jego podstawowe wdrożenia. Zadania oceniania wsadowego nie zostaną usunięte.

az ml batch-endpoint delete --name $ENDPOINT_NAME --yes

Jeśli nie będziesz używać starego wdrożenia wsadowego, usuń je, uruchamiając następujący kod.

ml_client.batch_deployments.begin_delete(
    endpoint_name=endpoint_name, name=deployment.name
).result()

Uruchom następujący kod, aby usunąć punkt końcowy wsadowy i wszystkie jego podstawowe wdrożenia. Zadania oceniania wsadowego nie zostaną usunięte.

ml_client.batch_endpoints.begin_delete(name=endpoint_name)

Uzyskiwanie dostępu do danych z zadań punktów końcowych wsadowych.
Uwierzytelnianie w punktach końcowych wsadowych.
Izolacja sieci w punktach końcowych wsadowych.
Rozwiązywanie problemów z punktami końcowymi wsadowymi.

Wdrażanie modeli oceniania w punktach końcowych wsadowych

Wymagania wstępne

Klonowanie repozytorium przykładów

Przygotowywanie systemu

Nawiązywanie połączenia z obszarem roboczym

Tworzenie zasobów obliczeniowych

Tworzenie punktu końcowego wsadowego

Tworzenie wdrożenia wsadowego

Uruchamianie punktów końcowych wsadowych i uzyskiwanie dostępu do wyników

Monitorowanie postępu wykonywania zadania wsadowego

Sprawdzanie wyników oceniania wsadowego

Konfigurowanie lokalizacji wyjściowej

Zastępowanie konfiguracji wdrożenia dla każdego zadania

Dodawanie wdrożeń do punktu końcowego

Dodawanie drugiego wdrożenia

Testowanie wdrożenia wsadowego innego niż domyślne

Aktualizowanie domyślnego wdrożenia wsadowego

Usuwanie punktu końcowego wsadowego i wdrożenia

Powiązana zawartość

Dodatkowe zasoby