Führen Sie die sichere Bereitstellung neuer Anwendungen für Echtzeitrückschlüsse durch.

Artikel
10/24/2023

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

In diesem Artikel erfahren Sie, wie Sie in der Produktion eine neue Version eines Machine Learning-Modells bereitstellen können, ohne dass es zu Unterbrechungen kommt. Sie verwenden die Blau-Grün-Bereitstellungsstrategie (auch sichere Rolloutstrategie genannt), um eine neue Version eines Webdiensts in der Produktion einzuführen. Mit dieser Strategie können Sie Ihre neue Version des Webdiensts für eine kleine Teilmenge von Benutzern oder Anforderungen bereitstellen, bevor Sie sie vollständig einführen.

In diesem Artikel wird davon ausgegangen, dass Sie Onlineendpunkte verwenden, d. h. Endpunkte, die für Onlinerückschlüsse (in Echtzeit) verwendet werden. Es gibt zwei Arten von Onlineendpunkten: Verwaltete Onlineendpunkte und Kubernetes-Onlineendpunkte. Weitere Informationen zu Endpunkten und den Unterschieden zwischen verwalteten Onlineendpunkten und Kubernetes-Onlineendpunkten finden Sie unter Was sind Azure Machine Learning-Endpunkte?.

Im Hauptbeispiel in diesem Artikel werden verwaltete Online-Endpunkte für die Bereitstellung verwendet. Wenn Sie stattdessen Kubernetes-Endpunkte verwenden möchten, lesen Sie die Hinweise in diesem Dokument im Zusammenhang mit der Diskussion über verwaltete Onlineendpunkte.

In diesem Artikel lernen Sie Folgendes:

Definieren eines Onlineendpunkts mit einer Bereitstellung namens „Blau“, um Version 1 eines Modells bereitzustellen
Skalieren der Blau-Bereitstellung, damit mehr Anforderungen verarbeitet werden können
Bereitstellen der Version 2 des Modells (als „Grün“-Bereitstellung bezeichnet) für den Endpunkt bereit, jedoch ohne Senden von Livedatenverkehr an die Bereitstellung
Isoliertes Testen der Bereitstellung „green“
Spiegeln eines Prozentsatzes des Livedatenverkehrs an die Grün-Bereitstellung, um sie zu überprüfen
Senden eines geringen Prozentsatzes des Livedatenverkehrs an die Grün-Bereitstellung
Senden des gesamten Livedatenverkehrs an die Grün-Bereitstellung
Löschen der nun nicht mehr genutzten ersten Bereitstellung „blue“

Voraussetzungen

Stellen Sie vor dem Ausführen der Schritte in diesem Artikel sicher, dass Sie über die folgenden erforderlichen Komponenten verfügen:

Die Azure CLI und die ml-Erweiterung der Azure CLI. Weitere Informationen finden Sie unter Installieren, Einrichten und Verwenden der CLI (v2).

Wichtig

In den CLI-Beispielen in diesem Artikel wird davon ausgegangen, dass Sie die Bash-Shell (oder eine kompatible Shell) verwenden, beispielsweise über ein Linux-System oder ein Windows-Subsystem für Linux.
Ein Azure Machine Learning-Arbeitsbereich. Sofern noch nicht vorhanden, führen Sie die Schritte im Abschnitt Installieren, Einrichten und Verwenden der CLI (v2) aus, um einen Arbeitsbereich zu erstellen.

Die rollenbasierte Zugriffssteuerung in Azure (Azure RBAC) wird verwendet, um Zugriff auf Vorgänge in Azure Machine Learning zu gewähren. Um die Schritte in diesem Artikel auszuführen, muss Ihr Benutzerkonto der Rolle Besitzer oder Mitwirkender für den Azure Machine Learning-Arbeitsbereich bzw. einer benutzerdefinierte Rolle zugewiesen werden, die Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* zulässt. Weitere Informationen finden Sie unter Zugriff auf einen Azure Machine Learning-Arbeitsbereich verwalten.
(Optional) Zur lokalen Bereitstellung müssen Sie die Docker-Engine auf Ihrem lokalen Computer installieren. Diese Option wird dringend empfohlen, um das Debuggen von Problemen zu vereinfachen.

GILT FÜR: Python SDK azure-ai-ml v2 (aktuell)

Stellen Sie vor dem Ausführen der Schritte in diesem Artikel sicher, dass Sie über die folgenden erforderlichen Komponenten verfügen:

Ein Azure Machine Learning-Arbeitsbereich. Wenn keiner vorliegt, führen Sie die Schritte unter Schnellstart: Erstellen von Arbeitsbereichsressourcen aus, um einen Arbeitsbereich zu erstellen.
Verwenden Sie zum Installieren des Python SDK v2 den folgenden Befehl:
```
pip install azure-ai-ml azure-identity
```
Verwenden Sie den folgenden Befehl, um eine vorhandene Installation des SDK auf die neueste Version zu aktualisieren:
```
pip install --upgrade azure-ai-ml azure-identity
```
Weitere Informationen finden Sie unter Installieren des Python SDK v2 für Azure Machine Learning.

Die rollenbasierte Zugriffssteuerung in Azure (Azure RBAC) wird verwendet, um Zugriff auf Vorgänge in Azure Machine Learning zu gewähren. Um die Schritte in diesem Artikel auszuführen, muss Ihr Benutzerkonto der Rolle Besitzer oder Mitwirkender für den Azure Machine Learning-Arbeitsbereich bzw. einer benutzerdefinierte Rolle zugewiesen werden, die Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* zulässt. Weitere Informationen finden Sie unter Zugriff auf einen Azure Machine Learning-Arbeitsbereich verwalten.
(Optional) Zur lokalen Bereitstellung müssen Sie die Docker-Engine auf Ihrem lokalen Computer installieren. Diese Option wird dringend empfohlen, um das Debuggen von Problemen zu vereinfachen.

Stellen Sie vor dem Ausführen der Schritte in diesem Artikel sicher, dass Sie über die folgenden erforderlichen Komponenten verfügen:

Ein Azure-Abonnement. Wenn Sie nicht über ein Azure-Abonnement verfügen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen. Probieren Sie die kostenlose oder kostenpflichtige Version von Azure Machine Learning aus.
Einen Azure Machine Learning-Arbeitsbereich und eine Compute-Instanz. Falls Sie nicht über diese Komponenten verfügen, führen Sie die Schritte unter Schnellstart: So erstellen Sie Arbeitsbereichsressourcen, die Sie für die ersten Schritte mit Azure Machine Learning benötigen aus, um sie zu erstellen.
Die rollenbasierte Zugriffssteuerung in Azure (Azure RBAC) wird verwendet, um Zugriff auf Vorgänge in Azure Machine Learning zu gewähren. Um die Schritte in diesem Artikel auszuführen, muss Ihr Benutzerkonto der Rolle Besitzer oder Mitwirkender für den Azure Machine Learning-Arbeitsbereich bzw. einer benutzerdefinierte Rolle zugewiesen werden, die Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* zulässt. Weitere Informationen finden Sie unter Zugriff auf einen Azure Machine Learning-Arbeitsbereich verwalten.

Vorbereiten Ihres Systems

Festlegen von Umgebungsvariablen

Wenn Sie die Standardeinstellungen für die Azure-Befehlszeilenschnittstelle noch nicht festgelegt haben, speichern Sie Ihre Standardeinstellungen. Um zu vermeiden, dass Sie die Werte für Ihr Abonnement, Ihren Arbeitsbereich und Ihre Ressourcengruppe mehrfach eingeben müssen, führen Sie den folgenden Code aus:

az account set --subscription <subscription id>
az configure --defaults workspace=<Azure Machine Learning workspace name> group=<resource group>

Klonen des Beispielrepositorys

Klonen Sie zunächst das Beispielrepository (azureml-examples), um diesem Artikel zu folgen. Wechseln Sie dann zum Verzeichnis cli/ des Repositorys:

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples
cd cli

Tipp

Verwenden Sie --depth 1, um nur den letzten Commit in das Repository zu klonen. Dadurch wird die Zeit zum Abschließen des Vorgangs reduziert.

Die in diesem Tutorial verwendeten Befehle befinden sich in der Datei deploy-safe-rollout-online-endpoints.sh im Verzeichnis cli, und die YAML-Konfigurationsdateien finden Sie im Unterverzeichnis endpoints/online/managed/sample/.

Hinweis

Die YAML-Konfigurationsdateien für Kubernetes-Onlineendpunkte befinden sich im Unterverzeichnis endpoints/online/kubernetes/.

Klonen des Beispielrepositorys

Klonen Sie zum Ausführen der Trainingsbeispiele zunächst das Repository mit den Beispielen (azureml-examples). Wechseln Sie dann in das Verzeichnis azureml-examples/sdk/python/endpoints/online/managed:

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/sdk/python/endpoints/online/managed

Tipp

Verwenden Sie --depth 1, um nur den letzten Commit in das Repository zu klonen. Dadurch wird die Zeit zum Abschließen des Vorgangs reduziert.

Die Informationen in diesem Artikel basieren auf dem Notebook online-endpoints-simple-deployment.ipynb. Es enthält denselben Inhalt wie dieser Artikel, wobei die Reihenfolge der Codes leicht abweicht.

Hinweis

Die Schritte für den Kubernetes-Onlineendpunkt basieren auf dem Notebook kubernetes-online-endpoints-safe-rollout.ipynb.

Herstellen einer Verbindung mit einem Azure Machine Learning-Arbeitsbereich

Der Arbeitsbereich ist die Ressource der obersten Ebene für Azure Machine Learning und ein zentraler Ort für die Arbeit mit allen Artefakten, die Sie während der Nutzung von Azure Machine Learning erstellen. In diesem Abschnitt stellen wir eine Verbindung mit dem Arbeitsbereich her, in dem Sie die Bereitstellung vornehmen werden. Öffnen Sie zum Nachvollziehen der Schritte das Notebook online-endpoints-safe-rollout.ipynb.

Importieren Sie die erforderlichen Bibliotheken.

# import required libraries
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    Model,
    Environment,
    CodeConfiguration,
)
from azure.identity import DefaultAzureCredential

Hinweis

Wenn Sie den Kubernetes-Onlineendpunkt verwenden, importieren Sie die Klassen KubernetesOnlineEndpoint und KubernetesOnlineDeployment aus der Bibliothek azure.ai.ml.entities.

Konfigurieren von Arbeitsbereichsdetails und Abrufen eines Handles für den Arbeitsbereich:

Um eine Verbindung mit dem Arbeitsbereich herzustellen, benötigen Sie Bezeichnerparameter: ein Abonnement, eine Ressourcengruppe und einen Arbeitsbereichsnamen. Sie verwenden diese Details im MLClient ab azure.ai.ml, um ein Handle zum erforderlichen Azure Machine Learning-Arbeitsbereich zu erhalten. In diesem Beispiel wird die Standardauthentifizierung von Azure verwendet.
```
# enter details of your AML workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AML_WORKSPACE_NAME>"
```
```
# get a handle to the workspace
ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)
```

Wenn Sie Git auf Ihrem lokalen Computer installiert haben, können Sie der Anleitung zum Klonen des Beispielrepositorys folgen. Folgen Sie andernfalls den Anweisungen zum Herunterladen von Dateien aus dem Beispielrepository.

Klonen des Beispielrepositorys

Klonen Sie zum Nachvollziehen der Schritte in diesem Artikel zunächst das Beispielrepository (azureml-examples), und wechseln Sie anschließend zum Verzeichnis azureml-examples/cli/endpoints/online/model-1.

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/cli/endpoints/online/model-1

Tipp

Verwenden Sie --depth 1, um nur den letzten Commit in das Repository zu klonen, wodurch das Abschließen des Vorgangs beschleunigt wird.

Herunterladen von Dateien aus dem Beispielrepository

Wenn Sie das Beispielrepository geklont haben, verfügt Ihr lokaler Computer bereits über Kopien der Dateien für dieses Beispiel, und Sie können mit dem nächsten Abschnitt fortfahren. Wenn Sie das Repository nicht geklont haben, können Sie es auf Ihren lokalen Computer herunterladen.

Gehe zu https://github.com/Azure/azureml-examples/.
Wählen Sie auf der Seite <> Code die Schaltfläche „Code“ und anschließend auf der Registerkarte Local die Option Download ZIP aus.
Suchen Sie nach dem Modellordner /cli/endpoints/online/model-1/model und nach dem Bewertungsskript /cli/endpoints/online/model-1/onlinescoring/score.py für ein erstes Modell (model-1).
Suchen Sie nach dem Modellordner /cli/endpoints/online/model-2/model und nach dem Bewertungsskript /cli/endpoints/online/model-2/onlinescoring/score.py für ein zweites Modell (model-2).

Definieren des Endpunkts und der Bereitstellung

Onlineendpunkte sind Endpunkte, die für Onlinerückschlüsse (in Echtzeit) verwendet werden. Onlineendpunkte enthalten Bereitstellungen, die bereit sind, Daten von Clients zu empfangen und Antworten in Echtzeit zurückzusenden.

Definieren eines Endpunkts

In der folgenden Tabelle sind wichtige Attribute aufgeführt, die beim Definieren eines Endpunkts angegeben werden müssen.

attribute	Beschreibung
Name	Erforderlich. Name des Endpunkts. Er muss in der Azure-Region eindeutig sein. Weitere Informationen zu den Benennungsregeln finden Sie unter Endpunktgrenzwerte.
Authentifizierungsmodus	Die Authentifizierungsmethode für den Endpunkt Wählen Sie zwischen schlüsselbasierter Authentifizierung (`key`) und tokenbasierter Azure Machine Learning-Authentifizierung (`aml_token`). Ein Schlüssel läuft nicht ab, ein Token dagegen schon. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizieren bei einem Onlineendpunkt.
BESCHREIBUNG	Eine Beschreibung des Endpunkts
Tags	Wörterbuch der Tags für den Endpunkt
Verkehr	Regeln zur bereitstellungsübergreifenden Weiterleitung von Datenverkehr. Der Datenverkehr wird als Wörterbuch mit Schlüssel-Wert-Paaren dargestellt, bei denen der Schlüssel den Bereitstellungsnamen und der Wert den Prozentsatz des Datenverkehrs für die entsprechende Bereitstellung darstellt. Der Datenverkehr kann erst festgelegt werden, wenn die Bereitstellungen unter einem Endpunkt erstellt wurden. Außerdem können Sie den Datenverkehr für einen Onlineendpunkt aktualisieren, nachdem die Bereitstellungen erstellt wurden. Weitere Informationen zur Verwendung von gespiegeltem Datenverkehr finden Sie unter Zuordnen eines geringen Prozentsatzes des Livedatenverkehrs zur neuen Bereitstellung.
Spiegeln des Datenverkehrs	Prozentsatz des Livedatenverkehrs, der in eine Bereitstellung gespiegelt werden soll. Weitere Informationen zur Verwendung von gespiegeltem Datenverkehr finden Sie unter Testen der Bereitstellung mit gespiegeltem Datenverkehr.

Eine vollständige Liste der Attribute, die Sie beim Erstellen eines Endpunkts angeben können, finden Sie unter CLI (v2): YAML-Schema für Onlineendpunkt bzw. unter ManagedOnlineEndpoint Class (Klasse „ManagedOnlineEndpoint“).

Definieren einer Bereitstellung

Eine Einrichtung ist ein Satz von Ressourcen, die für das Hosting des Modells erforderlich sind, das die eigentliche Inferenz durchführt. In der folgenden Tabelle werden Schlüsselattribute beschrieben, die beim Definieren einer Bereitstellung angegeben werden müssen.

attribute	Beschreibung
Name	Erforderlich. Name der Bereitstellung
Endpunktname	Erforderlich. Name des Endpunkts, unter dem die Bereitstellung erstellt werden soll.
Modell	Das für die Bereitstellung zu verwendende Modell. Dieser Wert kann entweder ein Verweis auf ein vorhandenes versioniertes Modell im Arbeitsbereich oder eine Inline-Modellspezifikation sein. In diesem Beispiel verwenden wir ein scikit-learn-Modell, das Regressionen durchführt.
Codepfad	Der Pfad zu dem Verzeichnis in der lokalen Entwicklungsumgebung, das den gesamten Python-Quellcode für die Bewertung des Modells enthält. Sie können geschachtelte Verzeichnisse und Pakete verwenden.
„Scoring script“ (Bewertungsskript)	Python-Code, der das Modell für eine bestimmte Eingabeanforderung ausführt. Dieser Wert kann der relative Pfad zur Bewertungsdatei im Quellcodeverzeichnis sein. Das Bewertungsskript empfängt an einen bereitgestellten Webdienst übermittelte Daten und übergibt sie an das Modell. Anschließend führt das Skript das Modell aus und gibt dessen Antwort an den Client zurück. Das Bewertungsskript ist modellspezifisch und muss die Daten verstehen, die das Modell als Eingabe erwartet und als Ausgabe zurückgibt. In diesem Beispiel wird die Datei score.py verwendet. Dieser Python-Code muss über eine `init()`- und eine `run()`-Funktion verfügen. Die Funktion `init()` wird aufgerufen, nachdem das Modell erstellt oder aktualisiert wurde. (Sie kann verwendet werden, um das Modell z. B. im Arbeitsspeicher zwischenzuspeichern.) Die Funktion `run()` wird bei jedem Aufruf des Endpunkts aufgerufen, um die tatsächliche Bewertung und Vorhersage auszuführen.
Umgebung	Erforderlich. Die Umgebung zum Hosten des Modells und des Codes. Dieser Wert kann entweder ein Verweis auf eine vorhandene versionierte Umgebung im Arbeitsbereich oder eine Inline-Umgebungsspezifikation sein. Die Umgebung kann ein Docker-Image mit Conda-Abhängigkeiten, ein Dockerfile oder eine registrierte Umgebung sein.
Instanztyp	Erforderlich. Die VM-Größe, die für die Bereitstellung verwendet werden soll. Eine Liste der unterstützten Größen finden Sie unter SKU-Liste für verwaltete Onlineendpunkte.
Anzahl von Instanzen	Erforderlich. Die Anzahl der Instanzen, die für die Bereitstellung verwendet werden sollen. Richten Sie den Wert nach der zu erwartenden Workload. Für Hochverfügbarkeit empfiehlt es sich, den Wert mindestens auf `3` festzulegen. Wir reservieren zusätzliche 20 % für die Durchführung von Upgrades. Weitere Informationen finden Sie unter Grenzwerte für Onlineendpunkte.

Eine vollständige Liste der Attribute, die Sie beim Erstellen einer Bereitstellung angeben können, finden Sie unter CLI (v2) verwaltete Onlinebereitstellung: YAML-Schema bzw. unter ManagedOnlineDeployment Class (Klasse „ManagedOnlineDeployment“).

Erstellen eines Onlineendpunkts

Legen Sie zunächst den Namen des Endpunkts fest, und konfigurieren Sie ihn. In diesem Artikel wird die Datei endpoints/online/managed/sample/endpoint.yml verwendet, um den Endpunkt zu konfigurieren. Der folgende Codeschnipsel zeigt den Inhalt der Datei:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

Die Referenz für das YAML-Endpunktformat wird in der folgenden Tabelle beschrieben. Eine Anleitung zum Angeben dieser Attribute finden Sie in der YAML-Referenz für Onlineendpunkte. Informationen zu Grenzwerten im Zusammenhang mit verwalteten Onlineendpunkten finden Sie unter Grenzwerte für Onlineendpunkte.

Schlüssel	BESCHREIBUNG
`$schema`	(Optional) Das YAML-Schema. Sie können das Schema aus dem vorherigen Codeschnipsel in einem Browser anzeigen, um sich alle verfügbaren Optionen in der YAML-Datei anzusehen.
`name`	Der Name des Endpunkts.
`auth_mode`	Verwenden Sie `key` für schlüsselbasierte Authentifizierung. Verwenden Sie `aml_token` für die tokenbasierte Azure Machine Learning-Authentifizierung. Verwenden Sie den Befehl `az ml online-endpoint get-credentials`, um das neueste Token abzurufen.

So erstellen Sie einen Onlineendpunkt:

Legen Sie den Namen des Endpunkts fest:

Führen Sie für Unix diesen Befehl aus (ersetzen Sie YOUR_ENDPOINT_NAME durch einen eindeutigen Namen):
```
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
```
Wichtig

Endpunktnamen müssen innerhalb einer Azure-Region eindeutig sein. In der Azure-Region „westus2“ kann es z. B. nur einen Endpunkt namens my-endpoint geben.
Erstellen Sie den Endpunkt in der Cloud:

Führen Sie den folgenden Code aus, um die Datei endpoint.yml zum Konfigurieren des Endpunkts zu verwenden:
```
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/managed/sample/endpoint.yml
```

Erstellen der Bereitstellung „blau“

In diesem Artikel verwenden Sie die Datei endpoints/online/managed/sample/blue-deployment.yml verwendet, um die wichtigsten Aspekte der Bereitstellung zu konfigurieren. Der folgende Codeschnipsel zeigt den Inhalt der Datei:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: blue
endpoint_name: my-endpoint
model:
  path: ../../model-1/model/
code_configuration:
  code: ../../model-1/onlinescoring/
  scoring_script: score.py
environment: 
  conda_file: ../../model-1/environment/conda.yaml
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
instance_type: Standard_DS3_v2
instance_count: 1

Führen Sie den folgenden Befehl aus, um für Ihren Endpunkt eine Bereitstellung namens blue zu erstellen und sie mithilfe der Datei blue-deployment.yml zu konfigurieren:

az ml online-deployment create --name blue --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/blue-deployment.yml --all-traffic

Wichtig

Das Flag --all-traffic im Befehl az ml online-deployment create ordnet den gesamten Endpunktdatenverkehr der neu erstellten blauen Bereitstellung zu.

In der Datei blue-deployment.yaml wird inline path (von wo aus Dateien hochgeladen werden sollen) angegeben. Die CLI lädt die Dateien automatisch hoch und registriert das Modell und die Umgebung. Als bewährte Methode für die Produktion sollten Sie das Modell und die Umgebung registrieren und den registrierten Namen sowie die Version im YAML-Code separat angeben. Verwenden Sie das Format model: azureml:my-model:1 oder environment: azureml:my-env:1.

Zur Registrierung können Sie die YAML-Definitionen von model und environment in separate YAML-Dateien extrahieren und die Befehle az ml model create und az ml environment create verwenden. Führen Sie az ml model create -h und az ml environment create -h aus, um mehr über diese Befehle zu erfahren.

Weitere Informationen zum Registrieren Ihres Modells als Ressource finden Sie unter Registrieren Ihres Modells als Ressource in Machine Learning mithilfe der CLI. Weitere Informationen zum Erstellen einer Umgebung finden Sie im Artikel Verwalten von Azure Machine Learning-Umgebungen mit der CLI und dem SDK (v2).

Erstellen eines Onlineendpunkts

Verwenden Sie die Klasse ManagedOnlineEndpoint, um einen verwalteten Onlineendpunkt zu erstellen. Mit dieser Klasse können Benutzer*innen die zentralen Aspekte des Endpunkts konfigurieren.

Konfigurieren des Endpunkts:

# Creating a unique endpoint name with current datetime to avoid conflicts
import random

online_endpoint_name = "endpt-moe-" + str(random.randint(0, 10000))

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint",
    auth_mode="key",
    tags={"foo": "bar"},
)

Hinweis

Verwenden Sie die Klasse KubernetesOnlineEndpoint, um einen Kubernetes-Onlineendpunkt zu erstellen.

Erstellen des Endpunkts:

ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Erstellen der Bereitstellung „blau“

Verwenden Sie die Klasse ManagedOnlineDeployment, um eine Bereitstellung für den verwalteten Onlineendpunkt zu erstellen. Mit dieser Klasse können Benutzer*innen die zentralen Aspekte der Bereitstellung konfigurieren. In der folgenden Tabelle werden die Attribute einer Bereitstellung (deployment) beschrieben:

Bereitstellung „blau“ konfigurieren:
```
# create blue deployment
model = Model(path="../model-1/model/sklearn_regression_model.pkl")
env = Environment(
    conda_file="../model-1/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    code_configuration=CodeConfiguration(
        code="../model-1/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)
```
In diesem Beispiel geben wir die path Inline -Datei (aus der Dateien hochgeladen werden) an. Das SDK lädt die Dateien automatisch hoch und registriert das Modell und die Umgebung. Als bewährte Methode für die Produktion sollten Sie das Modell und die Umgebung registrieren und den registrierten Namen sowie die Version in den Codes separat angeben.

Weitere Informationen zum Registrieren Ihres Modells als Ressource finden Sie unter Registrieren Ihres Modells als Ressource in Machine Learning mithilfe des SDK.

Weitere Informationen zum Erstellen einer Umgebung finden Sie im Artikel Verwalten von Azure Machine Learning-Umgebungen mit der CLI und dem SDK (v2).

Hinweis

Verwenden Sie die Klasse KubernetesOnlineDeployment, um eine Bereitstellung für einen Kubernetes-Onlineendpunkt zu erstellen.

Erstellen Sie die Bereitstellung:

ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Beim Erstellen eines verwalteten Onlineendpunkts im Azure Machine Learning Studio muss eine erste Bereitstellung für den Endpunkt definiert werden. Um eine Bereitstellung definieren zu können, müssen Sie über ein registriertes Modell in Ihrem Arbeitsbereich verfügen. Registrieren Sie zunächst das Modell, das für die Bereitstellung verwendet werden soll.

Registrieren Ihres Modells

Eine Modellregistrierung ist eine logische Entität im Arbeitsbereich. Diese Entität kann eine einzelne Modelldatei oder ein Verzeichnis mit mehreren Dateien enthalten. In der Produktion empfiehlt es sich, das Modell und die Umgebung zu registrieren. Beim Erstellen des Endpunkts und der Bereitstellung in diesem Artikel wird davon ausgegangen, dass Sie den Modellordner registriert haben, der das Modell enthält.

Gehen Sie wie folgt vor, um das Beispielmodell zu registrieren:

Wechseln Sie zum Azure Machine Learning-Studio.
Wählen Sie auf der linken Navigationsleiste die Seite Modelle aus.
Wählen Sie Registrieren und dann Aus lokalen Dateien aus.
Wählen Sie unter Modelltyp die Option Nicht angegebener Typ aus.
Wählen Sie Durchsuchen und anschließend Ordner durchsuchen aus.
Wählen Sie den Ordner \azureml-examples\cli\endpoints\online\model-1\model aus der lokalen Kopie des Repositorys aus, das Sie zuvor geklont oder heruntergeladen haben. Wählen bei entsprechender Aufforderung die Option Hochladen aus, und warten Sie, bis der Upload abgeschlossen ist.
Wählen Sie nach Abschluss des Ordneruploads die Option Weiter aus.
Geben Sie einen Anzeigenamen für das Modell ein. Bei den Schritten in diesem Artikel wird davon ausgegangen, dass der Name des Modells model-1 lautet.
Wählen Sie Weiter und dann Registrieren aus, um die Registrierung abzuschließen.
Wiederholen Sie die vorherigen Schritte, um ein zweites Modell (model-2) aus dem Ordner \azureml-examples\cli\endpoints\online\model-2\model in der lokalen Kopie des Repositorys zu registrieren, das Sie zuvor geklont oder heruntergeladen haben.

Weitere Informationen zum Arbeiten mit registrierten Modellen finden Sie unter Registrieren und Arbeiten mit Modellen.

Informationen zum Erstellen einer Umgebung im Studio finden Sie unter Erstellen einer Umgebung.

Erstellen eines verwalteten Onlineendpunkts und der blauen Bereitstellung

Verwenden Sie das Azure Machine Learning Studio, um einen verwalteten Onlineendpunkt direkt in Ihrem Browser zu erstellen. Beim Erstellen eines verwalteten Onlineendpunkts in Studio müssen Sie eine erste Bereitstellung definieren. Es ist nicht möglich, einen leeren verwalteten Onlineendpunkt zu erstellen.

Ein verwalteter Onlineendpunkt kann im Studio unter anderem über die Seite Modelle erstellt werden. Bei dieser Methode kann ein Modell auch ganz einfach einer bereits vorhandenen verwalteten Onlinebereitstellung hinzugefügt werden. Gehen Sie wie folgt vor, um das Modell model-1 bereitzustellen, das Sie zuvor im Abschnitt Registrieren Ihres Modells registriert haben:

Wechseln Sie zum Azure Machine Learning-Studio.
Wählen Sie auf der linken Navigationsleiste die Seite Modelle aus.
Wählen Sie das Modell model-1 aus, indem Sie den Kreis neben dem Modellnamen mit einem Häkchen versehen.
Wählen Sie Bereitstellen>Echtzeitendpunkt aus.

Daraufhin wird ein Fenster geöffnet, in dem Sie Details zu Ihrem Endpunkt angeben können.
Geben Sie unter Endpunktname einen Endpunktnamen ein.
Behalten Sie die Standardoptionen bei: Verwaltet für den Computetyp und Schlüsselbasierte Authentifizierung für den Authentifizierungstyp.
Wählen Sie Weiter aus, bis die Seite „Bereitstellung“ angezeigt wird. Führen Sie dort die folgenden Aufgaben aus:
- Nennen Sie die Bereitstellung „blue“.
- Aktivieren Sie das Kontrollkästchen Application Insights-Diagnose und -Datensammlung aktivieren, um später Diagramme der Aktivitäten Ihres Endpunkts im Studio anzeigen zu können.
Wählen Sie Weiter aus, um zur Registerkarte „Umgebung“ zu gelangen. Führen Sie hier die folgenden Schritte aus:
- Wählen Sie im Feld „Bewertungsdatei und Abhängigkeiten auswählen“ die Datei \azureml-examples\cli\endpoints\online\model-1\onlinescoring\score.py aus dem Repository aus, das Sie zuvor geklont oder heruntergeladen haben.
- Beginnen Sie mit der Eingabe von sklearn in das Suchfeld oberhalb der Liste der Umgebungen, und wählen Sie die zusammengestellte Umgebung AzureML-sklearn-0.24 aus.
Wählen Sie Weiter aus, um zur Seite „Compute“ zu gelangen. Behalten Sie hier die Standardoption für den virtuellen Computer (Standard_DS3_v2) bei, und ändern Sie die Instanzanzahl in „1“.
Wählen Sie Weiter aus, um die standardmäßige Datenverkehrszuordnung von 100 Prozent für die blaue Bereitstellung zu übernehmen.
Überprüfen Sie Ihre Bereitstellungseinstellungen, und wählen Sie die Schaltfläche Erstellen aus.

Alternativ können Sie einen verwalteten Onlineendpunkt auch über die Seite Endpunkte im Studio erstellen.

Wechseln Sie zum Azure Machine Learning-Studio.
Wählen Sie in der linken Navigationsleiste die Seite Endpunkte aus.
Wählen Sie + Erstellen aus.

Daraufhin wird ein Fenster geöffnet, in dem Sie Details zu Ihrem Endpunkt und zu Ihrer Bereitstellung angeben können. Geben Sie Einstellungen für Ihren Endpunkt und für Ihre Bereitstellung ein, wie in den vorherigen Schritten 5–11 beschrieben, und übernehmen Sie die Standardwerte, bis Sie zum Erstellen der Bereitstellung aufgefordert werden.

Überprüfen der vorhandenen Bereitstellung

Eine Möglichkeit, Ihre vorhandene Bereitstellung zu bestätigen, besteht darin, Ihren Endpunkt aufzurufen, damit er Ihr Modell für eine bestimmte Eingabeanforderung bewerten kann. Wenn Sie Ihren Endpunkt über die CLI oder das Python SDK aufrufen, können Sie den Namen der Bereitstellung angeben, die den eingehenden Datenverkehr empfängt.

Hinweis

Anders als die CLI oder das Python SDK erfordert Azure Machine Learning Studio, dass Sie eine Bereitstellung angeben, wenn Sie einen Endpunkt aufrufen.

Aufrufen eines Endpunkts mit dem Bereitstellungsnamen

Wenn Sie den Endpunkt mit dem Namen der Bereitstellung aufrufen, die Datenverkehr empfängt, leitet Azure Machine Learning den Datenverkehr des Endpunkts direkt an die angegebene Bereitstellung weiter und gibt deren Ausgabe zurück. Sie können die Option --deployment-namefür CLI v2 oder die Option deployment_namefür SDK v2 verwenden, um die Bereitstellung anzugeben.

Aufrufen eines Endpunkts ohne Angabe der Bereitstellung

Wenn Sie den Endpunkt aufrufen, ohne die Bereitstellung anzugeben, die Datenverkehr empfangen soll, leitet Azure Machine Learning den eingehenden Datenverkehr des Endpunkts basierend auf den Einstellungen für die Datenverkehrssteuerung an die Bereitstellungen im Endpunkt weiter.

Die Einstellungen für die Datenverkehrssteuerung ordnen jeder Bereitstellung im Endpunkt bestimmte Prozentsätze des eingehenden Datenverkehrs zu. Wenn Ihre Datenverkehrsregeln beispielsweise angeben, dass eine bestimmte Bereitstellung in Ihrem Endpunkt 40 % der Zeit eingehenden Datenverkehr empfängt, leitet Azure Machine Learning 40 % des Datenverkehrs des Endpunkts an diese Bereitstellung weiter.

Sie können den Status Ihres vorhandenen Endpunkts und Ihrer Bereitstellung anzeigen, indem Sie Folgendes ausführen:

az ml online-endpoint show --name $ENDPOINT_NAME 

az ml online-deployment show --name blue --endpoint $ENDPOINT_NAME

Es sollten der Endpunkt mit $ENDPOINT_NAME und eine Bereitstellung mit dem Namen blue angezeigt werden.

Testen des Endpunkts mit Beispieldaten

Der Endpunkt kann mithilfe des Befehls invoke aufgerufen werden. Wir senden eine Beispielanforderung mithilfe einer JSON-Datei.

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json

Überprüfen Sie den Status, um festzustellen, ob das Modell ohne Fehler bereitgestellt wurde:

ml_client.online_endpoints.get(name=online_endpoint_name)

Testen des Endpunkts mit Beispieldaten

Mithilfe der MLClient zuvor erstellten Version erhalten wir einen Handle an den Endpunkt. Der Endpunkt kann mithilfe des invoke Befehls mit den folgenden Parametern aufgerufen werden:

endpoint_name – Name des Endpunkts
request_file – Datei mit Anforderungsdaten
deployment_name – Name der spezifischen Bereitstellung, die in einem Endpunkt getestet werden soll

Wir senden eine Beispielanforderung mithilfe einer JSON-Datei.

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="../model-1/sample-request.json",
)

Skalieren Ihrer vorhandenen Bereitstellung zur Verarbeitung einer größeren Menge an Datenverkehr

In der unter Bereitstellen und Bewerten eines Machine Learning-Modells mit einem Onlineendpunkt beschriebenen Bereitstellung legen Sie den instance_count in der YAML-Bereitstellungsdatei auf den Wert 1 fest. Sie können mit dem update-Befehl aufskalieren:

az ml online-deployment update --name blue --endpoint-name $ENDPOINT_NAME --set instance_count=2

Hinweis

Beachten Sie, dass im oben genannten Befehl --set verwendet wird, um die Bereitstellungskonfiguration zu überschreiben. Alternativ können Sie die YAML-Datei aktualisieren und mithilfe der Eingabe --file als Eingabe an den Befehl update übergeben.

Mithilfe des zuvor erstellten MLClient erhalten wir einen Handle für die Bereitstellung. Die Bereitstellung kann skaliert werden, indem instance_count erhöht oder verringert wird.

# scale the deployment
blue_deployment = ml_client.online_deployments.get(
    name="blue", endpoint_name=online_endpoint_name
)
blue_deployment.instance_count = 2
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

Abrufen von Endpunktdetails

# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

Bereitstellen eines neuen Modells, ohne vorerst Datenverkehr zu senden

Erstellen Sie eine neue Bereitstellung mit dem Namen green:

az ml online-deployment create --name green --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/green-deployment.yml

Da green nicht explizit Datenverkehr zugeordnet wurde, ist null Datenverkehr zugeordnet. Sie können dies mithilfe dieses Befehls überprüfen:

az ml online-endpoint show -n $ENDPOINT_NAME --query traffic

Testen der neuen Bereitstellung

Obwohl green 0% des Datenverkehrs zugeordnet ist, können Sie sie direkt aufrufen, indem Sie den --deployment-Namen angeben:

az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment-name green --request-file endpoints/online/model-2/sample-request.json

Falls Sie einen REST-Client verwenden möchten, um die Bereitstellung ohne Verwendung von Datenverkehrsregeln direkt aufzurufen, müssen Sie den folgenden HTTP-Header festlegen: azureml-model-deployment: <deployment-name>. Der folgende Codeausschnitt verwendet curl, um die Bereitstellung direkt aufzurufen. Der Codeausschnitt sollte in UNIX/WSL-Umgebungen funktionieren:

# get the scoring uri
SCORING_URI=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query scoring_uri)
# use curl to invoke the endpoint
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --header "azureml-model-deployment: green" --data @endpoints/online/model-2/sample-request.json

Erstellen Sie eine neue Bereitstellung für den verwalteten Onlineendpunkt, und nennen Sie die Bereitstellung green:

# create green deployment
model2 = Model(path="../model-2/model/sklearn_regression_model.pkl")
env2 = Environment(
    conda_file="../model-2/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

green_deployment = ManagedOnlineDeployment(
    name="green",
    endpoint_name=online_endpoint_name,
    model=model2,
    environment=env2,
    code_configuration=CodeConfiguration(
        code="../model-2/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)

# use MLClient to create green deployment
ml_client.online_deployments.begin_create_or_update(green_deployment).result()

Hinweis

Wenn Sie eine Bereitstellung für einen Kubernetes-Onlineendpunkt erstellen, verwenden Sie die Klasse KubernetesOnlineDeployment, und geben Sie einen Kubernetes-Instanztyp in Ihrem Kubernetes-Cluster an.

Testen der neuen Bereitstellung

Obwohl green 0 % des zugeordneten Datenverkehrs aufweist, können Sie den Endpunkt und die Bereitstellung mit der JSON-Datei weiterhin aufrufen.

ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="green",
    request_file="../model-2/sample-request.json",
)

Erstellen Sie eine neue Bereitstellung, um sie Ihrem verwalteten Onlineendpunkt hinzuzufügen, und nennen Sie sie green.

Gehen Sie auf der Seite mit den Endpunktdetails wie folgt vor:

Wählen Sie auf der Seite „Details“ des Endpunkts die Schaltfläche + Bereitstellung hinzufügen aus.
Wählen Sie Ein Modell bereitstellen aus.
Wählen Sie Weiter aus, um zur Seite „Modell“ zu gelangen, und wählen Sie das Modell model-2 aus.
Wählen Sie Weiter aus, um zur Seite „Bereitstellung“ zu gelangen, und führen Sie die folgenden Aufgaben aus:
1. Nennen Sie die Bereitstellung „green“.
2. Aktivieren Sie die Application Insights-Diagnose und -Datensammlung.
Wählen Sie Weiter aus, um zur Registerkarte „Umgebung“ zu gelangen. Führen Sie hier die folgenden Schritte aus:
- Wählen Sie im Feld „Bewertungsdatei und Abhängigkeiten auswählen“ die Datei \azureml-examples\cli\endpoints\online\model-2\onlinescoring\score.py aus dem Repository aus, das Sie zuvor geklont oder heruntergeladen haben.
- Beginnen Sie mit der Eingabe von sklearn in das Suchfeld oberhalb der Liste der Umgebungen, und wählen Sie die zusammengestellte Umgebung AzureML-sklearn-0.24 aus.
Wählen Sie Weiter aus, um zur Seite „Compute“ zu gelangen. Behalten Sie hier die Standardoption für den virtuellen Computer (Standard_DS3_v2) bei, und ändern Sie die Instanzanzahl in „1“.
Wählen Sie Weiter aus, um zur Seite „Datenverkehr“ zu gelangen. Übernehmen Sie hier die standardmäßige Datenverkehrszuordnung für die Bereitstellungen (100 Prozent Datenverkehr für „blue“ und null Prozent Datenverkehr für „green“).
Wählen Sie Weiter aus, um Ihre Bereitstellungseinstellungen zu überprüfen.
Wählen Sie Erstellen aus, um die Bereitstellung zu erstellen.

Alternativ können Sie die Seite Modelle verwenden, um eine Bereitstellung hinzuzufügen:

Wählen Sie auf der linken Navigationsleiste die Seite Modelle aus.
Wählen Sie ein Modell aus, indem Sie im Kreis neben dem Modellnamen ein Häkchen einfügen.
Wählen Sie Bereitstellen>Echtzeitendpunkt aus.
Geben Sie an, dass Sie einen vorhandenen verwalteten Onlineendpunkt bereitstellen möchten.
Führen Sie die vorherigen Schritte 3 bis 9 aus, um die Erstellung der grünen Bereitstellung abzuschließen.

Hinweis

Wenn Sie einem Endpunkt eine neue Bereitstellung hinzufügen, können Sie die Datenverkehrsbilanz zwischen Bereitstellungen auf der Seite "Datenverkehr" anpassen. An diesem Punkt sollten Sie jedoch die standardmäßige Datenverkehrszuordnung für die Bereitstellungen beibehalten (100 % Datenverkehr für "blau" und 0 % Datenverkehr für "grün").

Testen der neuen Bereitstellung

green sind zwar null Prozent des Datenverkehrs zugeordnet, Sie können den Endpunkt und die Bereitstellung aber trotzdem aufrufen. Verwenden Sie auf der Seite mit den Endpunktdetails die Registerkarte Test, um Ihre verwaltete Onlinebereitstellung zu testen. Geben Sie eine Beispieleingabe ein, und zeigen Sie die Ergebnisse an.

Wählen Sie auf der Detailseite des Endpunkts die Registerkarte Test aus.
Wählen Sie im Dropdownmenü die grüne Bereitstellung aus.
Kopieren Sie die Beispieleingabe aus der JSON-Datei.
Fügen Sie die Beispieleingabe in das Testfeld ein.
Klicken Sie auf Test.

Testen der Bereitstellung mit gespiegeltem Datenverkehr

Nachdem Sie die grüne Bereitstellung (green) getestet haben, können Sie einen Prozentsatz des Livedatenverkehrs spiegeln (bzw. kopieren). Die Datenverkehrsspiegelung (auch Shadowing genannt) ändert nichts an den Ergebnissen, die an Clients zurückgegeben werden. Anforderungen gehen immer noch zu 100 Prozent an die blaue Bereitstellung (blue). Der gespiegelte Prozentsatz des Datenverkehrs wird kopiert und an die grüne Bereitstellung (green) übermittelt, damit Sie Statistiken und Protokolle sammeln können, ohne Ihre Clients zu beeinträchtigen. Die Spiegelung ist nützlich, wenn Sie eine neue Bereitstellung validieren möchten, ohne die Clients zu beeinträchtigen. So können Sie die Spiegelung beispielsweise verwenden, um zu prüfen, ob die Wartezeit innerhalb akzeptabler Grenzen liegt, oder um sich zu vergewissern, dass keine HTTP-Fehler vorliegen. Das Testen der neuen Bereitstellung mit der Spiegelung von Datenverkehr wird auch als Schattentests bezeichnet. Die Bereitstellung, die den gespiegelten Datenverkehr erhält – in diesem Fall die grüne Bereitstellung (green) –, kann auch als Schattenbereitstellung bezeichnet werden.

Für die Spiegelung gelten die folgenden Einschränkungen:

Die Spiegelung wird für die CLI (v2) ab Version 2.4.0 und für das Python SDK (v2) ab Version 1.0.0 unterstützt. Wenn Sie eine ältere Version der CLI bzw. des SDK verwenden, um einen Endpunkt zu aktualisieren, geht die Einstellung für gespiegelten Datenverkehr verloren.
Die Spiegelung wird derzeit nicht für Kubernetes-Onlineendpunkte unterstützt.
Datenverkehr kann nur an eine einzelne Bereitstellung an einem Endpunkt gespiegelt werden.
Maximal können 50 Prozent des Datenverkehrs gespiegelt werden. Dieser Grenzwert dient dazu, die Auswirkungen auf das Bandbreitenkontingent für Ihren Endpunkt (Standardwert: 5 MBit/s) zu reduzieren. Ihre Endpunktbandbreite wird gedrosselt, wenn Sie das zugeordnete Kontingent überschreiten. Informationen zur Überwachung von Endpunkten finden Sie unter Überwachen verwalteter Onlineendpunkte.

Beachten Sie außerdem das folgende Verhalten:

Eine Bereitstellung kann so konfiguriert werden, dass nur Livedatenverkehr oder nur gespiegelter Datenverkehr empfangen wird, aber nicht beides.
Wenn Sie einen Endpunkt aufrufen, können Sie den Namen einer seiner Bereitstellungen (auch einer Schattenbereitstellung) angeben, um die Vorhersage zurückzugeben.
Wenn Sie einen Endpunkt mit dem Namen der Bereitstellung aufrufen, die eingehenden Datenverkehr empfängt, spiegelt Azure Machine Learning den Datenverkehr nicht an die Schattenbereitstellung. Azure Machine Learning spiegelt Datenverkehr an die Schattenbereitstellung auf der Grundlage von Datenverkehr, der an den Endpunkt gesendet wird, wenn Sie keine Bereitstellung angeben.

Legen Sie nun fest, dass die grüne Bereitstellung zehn Prozent des gespiegelten Datenverkehrs erhalten soll. Clients erhalten weiterhin nur Vorhersagen auf der Grundlage der blauen Bereitstellung.

Diagram showing 10% traffic mirrored to one deployment.

Der folgende Befehl spiegelt 10 % des Datenverkehrs an die green-Bereitstellung:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=10"

Sie können gespiegelten Datenverkehr testen, indem Sie den Endpunkt mehrmals aufrufen, ohne eine Bereitstellung anzugeben, die den eingehenden Datenverkehr empfängt:

for i in {1..20} ; do
    az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
done

Sie können sich anhand der Protokolle der Bereitstellung vergewissern, dass ein bestimmter Prozentsatz des Datenverkehrs an die green-Bereitstellung gesendet wurde:

az ml online-deployment get-logs --name blue --endpoint $ENDPOINT_NAME

Nach dem Test können Sie den gespiegelten Datenverkehr auf Null festlegen, um die Spiegelung zu deaktivieren:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=0"

Der folgende Befehl spiegelt 10 % des Datenverkehrs an die green-Bereitstellung:

endpoint.mirror_traffic = {"green": 10}
ml_client.begin_create_or_update(endpoint).result()

Sie können gespiegelten Datenverkehr testen, indem Sie den Endpunkt mehrmals aufrufen, ohne eine Bereitstellung anzugeben, die den eingehenden Datenverkehr empfängt:

# You can test mirror traffic by invoking the endpoint several times
for i in range(20):
    ml_client.online_endpoints.invoke(
        endpoint_name=online_endpoint_name,
        request_file="../model-1/sample-request.json",
    )

Sie können sich anhand der Protokolle der Bereitstellung vergewissern, dass ein bestimmter Prozentsatz des Datenverkehrs an die green-Bereitstellung gesendet wurde:

ml_client.online_deployments.get_logs(
    name="green", endpoint_name=online_endpoint_name, lines=50
)

Nach dem Test können Sie den gespiegelten Datenverkehr auf Null festlegen, um die Spiegelung zu deaktivieren:

endpoint.mirror_traffic = {"green": 0}
ml_client.begin_create_or_update(endpoint).result()

So spiegeln Sie zehn Prozent des Datenverkehrs an die grüne Bereitstellung (green):

Wählen Sie auf der Seite „Details“ des Endpunkts die Option Datenverkehr aktualisieren aus.
Aktivieren Sie die Option Gespiegelten Datenverkehr aktivieren.
Wählen Sie im Dropdownmenü „Bereitstellungsname“ die grüne Bereitstellung (green) aus.
Behalten Sie die standardmäßige Datenverkehrszuordnung von zehn Prozent bei.
Wählen Sie Aktualisieren.

Auf der Seite mit den Endpunktdetails wird nun die gespiegelte Datenverkehrszuordnung von zehn Prozent für die grüne Bereitstellung (green) angezeigt.

Verwenden Sie zum Testen des gespiegelten Datenverkehrs die Azure CLI- oder Python-Registerkarten, um den Endpunkt mehrmals aufzurufen. Überprüfen Sie anhand der Protokolle der Bereitstellung, ob ein bestimmter Prozentsatz des Datenverkehrs an die Bereitstellung green gesendet wurde. Sie können auf die Bereitstellungsprotokolle über die Registerkarte Bereitstellungsprotokolle des Endpunkts zugreifen. Sie können auch Metriken und Protokolle verwenden, um die Leistung des gespiegelten Datenverkehrs zu überwachen. Weitere Informationen finden Sie unter Online-Endpunkte überwachen.

Nach dem Testen können Sie die Spiegelung deaktivieren:

Wählen Sie auf der Seite „Details“ des Endpunkts die Option Datenverkehr aktualisieren aus.
Deaktivieren Sie gespiegelten Datenverkehr, indem Sie die Option Gespiegelten Datenverkehr aktivieren wieder deaktivieren.
Wählen Sie Aktualisieren.

Zuordnen eines geringen Prozentsatzes des Livedatenverkehrs zur neuen Bereitstellung

Nachdem Sie Ihre green-Bereitstellung getestet haben, weisen Sie ihr einen kleinen Prozentsatz des Datenverkehrs zu:

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=90 green=10"

Nachdem Sie Ihre green-Bereitstellung getestet haben, weisen Sie ihr einen kleinen Prozentsatz des Datenverkehrs zu:

endpoint.traffic = {"blue": 90, "green": 10}
ml_client.begin_create_or_update(endpoint).result()

Tipp

Der Gesamtprozentsatz des Datenverkehrs muss entweder null Prozent (Datenverkehr deaktivieren) oder 100 Prozent (Datenverkehr aktivieren) ergeben.

Ihre grüne Bereitstellung (green) erhält jetzt zehn Prozent des gesamten Livedatenverkehrs. Clients erhalten Vorhersagen sowohl von der blauen Bereitstellung (blue) als auch von der grünen Bereitstellung (green).

Diagram showing traffic split between deployments.

Senden des gesamten Datenverkehrs an Ihre neue Bereitstellung

Wenn Sie mit der green-Bereitstellung zufrieden sind, können Sie den gesamten Datenverkehr auf sie umstellen.

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=0 green=100"

Wenn Sie mit der green-Bereitstellung zufrieden sind, können Sie den gesamten Datenverkehr auf sie umstellen.

endpoint.traffic = {"blue": 0, "green": 100}
ml_client.begin_create_or_update(endpoint).result()

Entfernen der alten Bereitstellung

Führen Sie die folgenden Schritte aus, um eine einzelne Bereitstellung von einem verwalteten Onlineendpunkt zu löschen. Das Löschen einer einzelnen Bereitstellung hat Auswirkungen auf die anderen Bereitstellungen des verwalteten Onlineendpunkts:

az ml online-deployment delete --name blue --endpoint $ENDPOINT_NAME --yes --no-wait

ml_client.online_deployments.begin_delete(
    name="blue", endpoint_name=online_endpoint_name
).wait()

Löschen des Endpunkts und der Bereitstellung

Wenn Sie den Endpunkt und die Bereitstellung nicht verwenden, sollten Sie sie löschen. Wenn Sie den Endpunkt löschen, werden auch alle zugrunde liegenden Bereitstellungen gelöscht.

az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait

Wenn Sie den Endpunkt und die Bereitstellung nicht verwenden, sollten Sie sie löschen. Wenn Sie den Endpunkt löschen, werden auch alle zugrunde liegenden Bereitstellungen gelöscht.

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

Führen Sie die sichere Bereitstellung neuer Anwendungen für Echtzeitrückschlüsse durch.

Voraussetzungen

Vorbereiten Ihres Systems

Festlegen von Umgebungsvariablen

Klonen des Beispielrepositorys

Klonen des Beispielrepositorys

Herstellen einer Verbindung mit einem Azure Machine Learning-Arbeitsbereich

Klonen des Beispielrepositorys

Herunterladen von Dateien aus dem Beispielrepository

Definieren des Endpunkts und der Bereitstellung

Definieren eines Endpunkts

Definieren einer Bereitstellung

Erstellen eines Onlineendpunkts

Erstellen der Bereitstellung „blau“

Erstellen eines Onlineendpunkts

Erstellen der Bereitstellung „blau“

Registrieren Ihres Modells

Erstellen eines verwalteten Onlineendpunkts und der blauen Bereitstellung

Überprüfen der vorhandenen Bereitstellung

Aufrufen eines Endpunkts mit dem Bereitstellungsnamen

Aufrufen eines Endpunkts ohne Angabe der Bereitstellung

Testen des Endpunkts mit Beispieldaten

Testen des Endpunkts mit Beispieldaten

Anzeigen von verwalteten Onlineendpunkten

Testen des Endpunkts mit Beispieldaten

Skalieren Ihrer vorhandenen Bereitstellung zur Verarbeitung einer größeren Menge an Datenverkehr

Abrufen von Endpunktdetails

Bereitstellen eines neuen Modells, ohne vorerst Datenverkehr zu senden

Testen der neuen Bereitstellung

Testen der neuen Bereitstellung

Testen der neuen Bereitstellung

Testen der Bereitstellung mit gespiegeltem Datenverkehr

Zuordnen eines geringen Prozentsatzes des Livedatenverkehrs zur neuen Bereitstellung

Senden des gesamten Datenverkehrs an Ihre neue Bereitstellung

Entfernen der alten Bereitstellung

Löschen des Endpunkts und der Bereitstellung

Zusätzliche Ressourcen

Führen Sie die sichere Bereitstellung neuer Anwendungen für Echtzeitrückschlüsse durch.

Voraussetzungen

Vorbereiten Ihres Systems

Festlegen von Umgebungsvariablen

Klonen des Beispielrepositorys

Definieren des Endpunkts und der Bereitstellung

Definieren eines Endpunkts

Definieren einer Bereitstellung

Erstellen eines Onlineendpunkts

Erstellen der Bereitstellung „blau“

Überprüfen der vorhandenen Bereitstellung

Aufrufen eines Endpunkts mit dem Bereitstellungsnamen

Aufrufen eines Endpunkts ohne Angabe der Bereitstellung

Testen des Endpunkts mit Beispieldaten

Skalieren Ihrer vorhandenen Bereitstellung zur Verarbeitung einer größeren Menge an Datenverkehr

Bereitstellen eines neuen Modells, ohne vorerst Datenverkehr zu senden

Testen der neuen Bereitstellung

Testen der Bereitstellung mit gespiegeltem Datenverkehr

Zuordnen eines geringen Prozentsatzes des Livedatenverkehrs zur neuen Bereitstellung

Senden des gesamten Datenverkehrs an Ihre neue Bereitstellung

Entfernen der alten Bereitstellung

Löschen des Endpunkts und der Bereitstellung

Zugehöriger Inhalt

Zusätzliche Ressourcen