Eseguire l'implementazione sicura delle nuove distribuzioni per l'inferenza in tempo reale

Articolo
10/24/2023

SI APPLICA A:estensione ml dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)

In questo articolo si apprenderà come distribuire una nuova versione di un modello di Machine Learning nell'ambiente di produzione senza causare interruzioni. Si userà una strategia di distribuzione blu-verde (nota anche come strategia di implementazione sicura) per introdurre una nuova versione di un servizio Web nell'ambiente di produzione. Questa strategia consentirà di implementare la nuova versione del servizio Web in un piccolo subset di utenti o richieste prima di implementarla completamente.

Questo articolo presuppone che si usino endpoint online, ovvero endpoint usati per l'inferenza online (in tempo reale). Esistono due tipi di endpoint online: endpoint online gestiti ed endpoint online Kubernetes. Per altre informazioni sugli endpoint e sulle differenze tra endpoint online gestiti e endpoint online Kubernetes, vedere Che cosa sono gli endpoint di Azure Machine Learning?.

L'esempio principale in questo articolo usa endpoint online gestiti per la distribuzione. Per usare invece gli endpoint Kubernetes, vedere le note contenute in questo documento inline con la discussione sull'endpoint online gestito.

In questo articolo si apprenderà come:

Definire un endpoint online con una distribuzione denominata "blu" per servire la versione 1 di un modello
Ridimensionare la distribuzione blu in modo che possa gestire più richieste
Distribuire la versione 2 del modello (denominata distribuzione "verde") all'endpoint, ma inviare la distribuzione senza traffico in tempo reale
Testare la distribuzione verde in isolamento
Eseguire il mirroring di una percentuale di traffico attivo verso la distribuzione verde per convalidarla
Inviare una piccola percentuale di traffico in tempo reale alla distribuzione verde
Inviare tutto il traffico live alla distribuzione verde
Eliminare la distribuzione blu v1 non usata

Prerequisiti

Prima di seguire i passaggi descritti in questo articolo, assicurarsi di disporre dei prerequisiti seguenti:

L'interfaccia della riga di comando di Azure e l'estensione ml all'interfaccia della riga di comando di Azure. Per altre informazioni, vedere Installare, configurare e usare l'interfaccia della riga di comando (v2).

Importante

Gli esempi dell'interfaccia della riga di comando in questo articolo presuppongono che si usi la shell Bash (o compatibile). Ad esempio, da un sistema Linux o da un sottosistema Windows per Linux.
Un'area di lavoro di Azure Machine Learning. Se non è disponibile, usare la procedura descritta in Installare, configurare e usare l'interfaccia della riga di comando (v2) per crearne una.

I controlli degli accessi in base al ruolo di Azure vengono usati per concedere l'accesso alle operazioni in Azure Machine Learning. Per eseguire la procedura descritta in questo articolo, all'account utente deve essere assegnato il ruolo di proprietario o collaboratore per l'area di lavoro di Azure Machine Learning o a un ruolo personalizzato che consente Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*. Per altre informazioni, vedere Gestire l'accesso a un'area di lavoro di Azure Machine Learning.
(Facoltativo) Per eseguire la distribuzione in locale, è necessario installare il motore Docker nel computer locale. Si consiglia vivamente questa opzione, quindi è più semplice eseguire il debug dei problemi.

SI APPLICA A: Python SDK azure-ai-ml v2 (corrente)

Prima di seguire i passaggi descritti in questo articolo, assicurarsi di disporre dei prerequisiti seguenti:

Un'area di lavoro di Azure Machine Learning. Se non è disponibile, seguire la procedura descritta nell'articolo Avvio rapido: Creare risorse dell'area di lavoro per crearne uno.
Per installare Python SDK v2, usare il comando seguente:
```
pip install azure-ai-ml azure-identity
```
Per aggiornare un'installazione esistente dell'SDK alla versione più recente, usare il comando seguente:
```
pip install --upgrade azure-ai-ml azure-identity
```
Per altre informazioni, vedere Installare Python SDK v2 per Azure Machine Learning.

I controlli degli accessi in base al ruolo di Azure vengono usati per concedere l'accesso alle operazioni in Azure Machine Learning. Per eseguire la procedura descritta in questo articolo, all'account utente deve essere assegnato il ruolo di proprietario o collaboratore per l'area di lavoro di Azure Machine Learning o a un ruolo personalizzato che consente Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*. Per altre informazioni, vedere Gestire l'accesso a un'area di lavoro di Azure Machine Learning.
(Facoltativo) Per eseguire la distribuzione in locale, è necessario installare il motore Docker nel computer locale. Si consiglia vivamente questa opzione, quindi è più semplice eseguire il debug dei problemi.

Prima di seguire i passaggi descritti in questo articolo, assicurarsi di disporre dei prerequisiti seguenti:

Una sottoscrizione di Azure. Se non si ha una sottoscrizione di Azure, creare un account gratuito prima di iniziare. Provare la versione gratuita o a pagamento di Azure Machine Learning.
Un'area di lavoro di Azure Machine Learning e un'istanza di calcolo. Se non sono disponibili, seguire la procedura descritta nell'articolo Avvio rapido: Creare le risorse dell'area di lavoro per crearle.
I controlli degli accessi in base al ruolo di Azure vengono usati per concedere l'accesso alle operazioni in Azure Machine Learning. Per eseguire la procedura descritta in questo articolo, all'account utente deve essere assegnato il ruolo di proprietario o collaboratore per l'area di lavoro di Azure Machine Learning o a un ruolo personalizzato che consente Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*. Per altre informazioni, vedere Gestire l'accesso a un'area di lavoro di Azure Machine Learning.

Preparare il sistema

Impostare le variabili di ambiente

Se non sono già state impostate le impostazioni predefinite per l'interfaccia della riga di comando di Azure, salvare le impostazioni predefinite. Per evitare di passare più volte i valori per la sottoscrizione, l'area di lavoro e il gruppo di risorse, eseguire questo codice:

az account set --subscription <subscription id>
az configure --defaults workspace=<Azure Machine Learning workspace name> group=<resource group>

Clonare il repository di esempi

Per seguire questo articolo, clonare prima di tutto il repository di esempi (azureml-examples). Passare quindi alla directory del cli/ repository:

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples
cd cli

Suggerimento

Usare --depth 1 per clonare solo il commit più recente nel repository. In questo modo si riduce il tempo necessario per completare l'operazione.

I comandi di questa esercitazione si trovano nel file deploy-safe-rollout-online-endpoints.sh nella cli directory e i file di configurazione YAML si trovano nella endpoints/online/managed/sample/ sottodirectory .

Nota

I file di configurazione YAML per gli endpoint online kubernetes si trovano nella endpoints/online/kubernetes/ sottodirectory.

Clonare il repository di esempi

Per eseguire gli esempi di training, clonare prima di tutto il repository di esempi (azureml-examples).To run the training examples, first clone the examples repository (azureml-examples). Passare quindi alla azureml-examples/sdk/python/endpoints/online/managed directory:

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/sdk/python/endpoints/online/managed

Suggerimento

Usare --depth 1 per clonare solo il commit più recente nel repository. In questo modo si riduce il tempo necessario per completare l'operazione.

Le informazioni contenute in questo articolo si basano sul notebook online-endpoints-safe-rollout.ipynb . Contiene lo stesso contenuto di questo articolo, anche se l'ordine dei codici è leggermente diverso.

Nota

I passaggi per l'endpoint online Kubernetes si basano sul notebook kubernetes-online-endpoints-safe-rollout.ipynb .

Connessione all'area di lavoro di Azure Machine Learning

L'area di lavoro è la risorsa di primo livello per Azure Machine Learning, che offre una posizione centralizzata per lavorare con tutti gli artefatti creati quando si usa Azure Machine Learning. In questa sezione ci si connetterà all'area di lavoro in cui verranno eseguite le attività di distribuzione. Per seguire la procedura, aprire il online-endpoints-safe-rollout.ipynb notebook.

Importare le librerie necessarie:

# import required libraries
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    Model,
    Environment,
    CodeConfiguration,
)
from azure.identity import DefaultAzureCredential

Nota

Se si usa l'endpoint online Kubernetes, importare la KubernetesOnlineEndpoint classe e KubernetesOnlineDeployment dalla azure.ai.ml.entities libreria.

Configurare i dettagli dell'area di lavoro e ottenere un handle per l'area di lavoro:

Per connettersi a un'area di lavoro, sono necessari parametri di identificatore, ovvero una sottoscrizione, un gruppo di risorse e un nome dell'area di lavoro. Questi dettagli verranno usati in from MLClientazure.ai.ml per ottenere un handle per l'area di lavoro di Azure Machine Learning necessaria. Questo esempio usa l'autenticazione di Azure predefinita.
```
# enter details of your AML workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AML_WORKSPACE_NAME>"
```
```
# get a handle to the workspace
ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)
```

Se Git è installato nel computer locale, è possibile seguire le istruzioni per clonare il repository di esempi. In caso contrario, seguire le istruzioni per scaricare i file dal repository di esempi.

Clonare il repository di esempi

Per seguire questo articolo, clonare prima il repository di esempi (azureml-examples) e quindi passare alla azureml-examples/cli/endpoints/online/model-1 directory.

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/cli/endpoints/online/model-1

Suggerimento

Usare --depth 1 per clonare solo il commit più recente nel repository, riducendo il tempo necessario per completare l'operazione.

Scaricare i file dal repository di esempi

Se è stato clonato il repository di esempi, il computer locale dispone già di copie dei file per questo esempio ed è possibile passare alla sezione successiva. Se il repository non è stato clonato, è possibile scaricarlo nel computer locale.

Vai a https://github.com/Azure/azureml-examples/.
Passare al <> pulsante Codice nella pagina e quindi selezionare Scarica ZIP dalla scheda Locale .
Individuare la cartella /cli/endpoints/online/model-1/model del modello e lo script /cli/endpoints/online/model-1/onlinescoring/score.py di assegnazione dei punteggi per un primo modello model-1.
Individuare la cartella /cli/endpoints/online/model-2/model del modello e lo script /cli/endpoints/online/model-2/onlinescoring/score.py di assegnazione dei punteggi per un secondo modello model-2.

Definire l'endpoint e la distribuzione

Gli endpoint online sono usati per l'inferenza online (in tempo reale). Gli endpoint online contengono distribuzioni pronte per ricevere dati dai client e inviare risposte in tempo reale.

Definire un endpoint

Nella tabella seguente sono elencati gli attributi chiave da specificare quando si definisce un endpoint.

Attributo	Descrizione
Name	Obbligatorio. Nome dell'endpoint. Deve essere univoco nell'area di Azure. Per altre informazioni sulle regole di denominazione, vedere Limiti degli endpoint.
Modalità di autenticazione	Metodo di autenticazione per l'endpoint. Scegliere tra l'autenticazione basata su chiave e l'autenticazione `keyaml_token`basata su token di Azure Machine Learning. Una chiave non scade, ma un token scade. Per altre informazioni sull'autenticazione, vedere Eseguire l'autenticazione a un endpoint online.
Descrizione	Descrizione dell'endpoint.
Tag	Dizionario dei tag per l'endpoint.
Traffico	Regole su come instradare il traffico tra le distribuzioni. Rappresentare il traffico come dizionario di coppie chiave-valore, dove la chiave rappresenta il nome e il valore della distribuzione rappresenta la percentuale di traffico verso tale distribuzione. È possibile impostare il traffico solo quando sono state create le distribuzioni in un endpoint. È anche possibile aggiornare il traffico per un endpoint online dopo la creazione delle distribuzioni. Per altre informazioni su come usare il traffico con mirroring, vedere Allocare una piccola percentuale di traffico in tempo reale alla nuova distribuzione.
Eseguire il mirroring del traffico	Percentuale di traffico attivo da eseguire con mirroring a una distribuzione. Per altre informazioni su come usare il traffico con mirroring, vedere Testare la distribuzione con il traffico con mirroring.

Per visualizzare un elenco completo degli attributi che è possibile specificare quando si crea un endpoint, vedere Schema YAML dell'endpoint online dell'interfaccia della riga di comando (v2) o classe ManagedOnlineEndpoint (v2).

Definire una distribuzione

Una distribuzione è un set di risorse necessarie per ospitare il modello che esegue l'inferenza effettiva. Nella tabella seguente vengono descritti gli attributi chiave da specificare quando si definisce una distribuzione.

Attributo	Descrizione
Name	Obbligatorio. Nome della distribuzione.
Nome endpoint	Obbligatorio. Nome dell'endpoint in cui creare la distribuzione.
Modello	Modello da usare per la distribuzione. Questo valore può essere un riferimento a un modello con controllo delle versioni esistente nell'area di lavoro o a una specifica del modello inline. Nell'esempio è disponibile un modello scikit-learn che esegue la regressione.
Percorso del codice	Percorso della directory nell'ambiente di sviluppo locale che contiene tutto il codice sorgente Python per l'assegnazione del punteggio al modello. È possibile usare directory e pacchetti annidati.
Scoring script (Script di assegnazione punteggi)	Codice Python che esegue il modello in una determinata richiesta di input. Questo valore può essere il percorso relativo del file di assegnazione dei punteggi nella directory del codice sorgente. Lo script di assegnazione dei punteggi riceve i dati inviati a un servizio Web distribuito e lo passa al modello. Lo script esegue quindi il modello e restituisce la risposta al client. Lo script di assegnazione dei punteggi è specifico del modello e deve comprendere i dati previsti dal modello come input e restituiti come output. In questo esempio è disponibile un file score.py . Questo codice Python deve avere una `init()` funzione e una `run()` funzione. La `init()` funzione verrà chiamata dopo la creazione o l'aggiornamento del modello ( ad esempio, è possibile usarla per memorizzare nella cache il modello in memoria). La `run()` funzione viene chiamata a ogni chiamata dell'endpoint per eseguire l'effettivo punteggio e la stima.
Ambiente	Obbligatorio. Ambiente in cui ospitare il modello e il codice. Questo valore può essere un riferimento a un ambiente con controllo delle versioni esistente nell'area di lavoro o a una specifica dell'ambiente inline. L'ambiente può essere un'immagine Docker con dipendenze Conda, un Dockerfile o un ambiente registrato.
Tipo di istanza	Obbligatorio. Dimensioni della macchina virtuale da usare per la distribuzione. Per l'elenco delle dimensioni supportate, vedere Elenco degli SKU degli endpoint online gestiti.
Numero di istanze	Obbligatorio. Numero di istanze da usare per la distribuzione. Basare il valore sul carico di lavoro previsto. Per la disponibilità elevata, è consigliabile impostare il valore su almeno `3`. Si riserva un ulteriore 20% per l'esecuzione degli aggiornamenti. Per altre informazioni, vedere Limiti per gli endpoint online.

Per visualizzare un elenco completo degli attributi che è possibile specificare quando si crea una distribuzione, vedere Schema YAML della distribuzione online gestita dall'interfaccia della riga di comando (v2) ManagedOnlineDeployment Class (classe YAML) gestita dall'interfaccia della riga di comando (v2).

Creare un endpoint online

Impostare prima il nome dell'endpoint e quindi configurarlo. In questo articolo si userà il file endpoints/online/managed/sample/endpoint.yml per configurare l'endpoint. Il frammento di codice seguente mostra il contenuto del file:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

Il riferimento per il formato YAML dell'endpoint è descritto nella tabella seguente. Per informazioni su come specificare questi attributi, vedere le informazioni di riferimento sull'endpoint YAML online. Per informazioni sui limiti correlati agli endpoint online gestiti, vedere Limiti per gli endpoint online.

Chiave	Descrizione
`$schema`	(Facoltativo) Schema YAML. Per visualizzare tutte le opzioni disponibili nel file YAML, è possibile visualizzare lo schema nel frammento di codice precedente in un browser.
`name`	Nome dell'endpoint.
`auth_mode`	Usare `key` per l'autenticazione basata su chiave. Usare `aml_token` per l'autenticazione basata su token di Azure Machine Learning. Per ottenere il token più recente, usare il `az ml online-endpoint get-credentials` comando .

Per creare un endpoint online:

Impostare il nome dell'endpoint:

Per Unix, eseguire questo comando (sostituire YOUR_ENDPOINT_NAME con un nome univoco):
```
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
```
Importante

I nomi degli endpoint devono essere univoci all'interno di un'area di Azure. Nell'area di Azure westus2 , ad esempio, può essere presente un solo endpoint con il nome my-endpoint.
Creare l'endpoint nel cloud:

Eseguire il codice seguente per usare il endpoint.yml file per configurare l'endpoint:
```
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/managed/sample/endpoint.yml
```

Creare la distribuzione "blue"

In questo articolo si userà il file endpoints/online/managed/sample/blue-deployment.yml per configurare gli aspetti chiave della distribuzione. Il frammento di codice seguente mostra il contenuto del file:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: blue
endpoint_name: my-endpoint
model:
  path: ../../model-1/model/
code_configuration:
  code: ../../model-1/onlinescoring/
  scoring_script: score.py
environment: 
  conda_file: ../../model-1/environment/conda.yaml
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
instance_type: Standard_DS3_v2
instance_count: 1

Per creare una distribuzione denominata blue per l'endpoint, eseguire il comando seguente per usare il blue-deployment.yml file da configurare

az ml online-deployment create --name blue --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/blue-deployment.yml --all-traffic

Importante

Il --all-traffic flag in az ml online-deployment create alloca il 100% del traffico dell'endpoint alla distribuzione blu appena creata.

blue-deployment.yaml Nel file si specifica path (da dove caricare i file) inline. L'interfaccia della riga di comando carica automaticamente i file e registra il modello e l'ambiente. Come procedura consigliata per la produzione, è necessario registrare il modello e l'ambiente e specificare il nome e la versione registrati separatamente in YAML. Usare il modulo model: azureml:my-model:1 o environment: azureml:my-env:1.

Per la registrazione, è possibile estrarre le definizioni YAML di model e environment in file YAML separati e usare i az ml model create comandi e az ml environment create. Per altre informazioni su questi comandi, eseguire az ml model create -h e az ml environment create -h.

Per altre informazioni sulla registrazione del modello come asset, vedere Registrare il modello come asset in Machine Learning usando l'interfaccia della riga di comando. Per altre informazioni sulla creazione di un ambiente, vedere Gestire gli ambienti di Azure Machine Learning con l'interfaccia della riga di comando e l'SDK (v2).

Creare un endpoint online

Per creare un endpoint online gestito, usare la ManagedOnlineEndpoint classe . Questa classe consente agli utenti di configurare gli aspetti chiave dell'endpoint.

Configurare l'endpoint:

# Creating a unique endpoint name with current datetime to avoid conflicts
import random

online_endpoint_name = "endpt-moe-" + str(random.randint(0, 10000))

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint",
    auth_mode="key",
    tags={"foo": "bar"},
)

Nota

Per creare un endpoint online Kubernetes, usare la KubernetesOnlineEndpoint classe .

Creare l'endpoint:

ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Creare la distribuzione "blue"

Per creare una distribuzione per l'endpoint online gestito, usare la ManagedOnlineDeployment classe . Questa classe consente agli utenti di configurare gli aspetti chiave della distribuzione. Nella tabella seguente vengono descritti gli attributi di un oggetto deployment:

Configurare la distribuzione blu:
```
# create blue deployment
model = Model(path="../model-1/model/sklearn_regression_model.pkl")
env = Environment(
    conda_file="../model-1/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    code_configuration=CodeConfiguration(
        code="../model-1/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)
```
In questo esempio viene specificato il path (da cui caricare i file) inline. L'SDK carica automaticamente i file e registra il modello e l'ambiente. Come procedura consigliata per l'ambiente di produzione, è necessario registrare il modello e l'ambiente e specificare il nome e la versione registrati separatamente nei codici.

Per altre informazioni sulla registrazione del modello come asset, vedere Registrare il modello come asset in Machine Learning usando l'SDK.

Per altre informazioni sulla creazione di un ambiente, vedere Gestire gli ambienti di Azure Machine Learning con l'interfaccia della riga di comando e l'SDK (v2).

Nota

Per creare una distribuzione per un endpoint online Kubernetes, usare la KubernetesOnlineDeployment classe .

Creare la distribuzione:

ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Quando si crea un endpoint online gestito nella studio di Azure Machine Learning, è necessario definire una distribuzione iniziale per l'endpoint. Prima di poter definire una distribuzione, è necessario disporre di un modello registrato nell'area di lavoro. Per iniziare, registrare il modello da usare per la distribuzione.

Registrare il modello

Una registrazione del modello è un'entità logica nell'area di lavoro. Questa entità può contenere un singolo file di modello o una directory di più file. Come procedura consigliata per la produzione, è necessario registrare il modello e l'ambiente. Quando si crea l'endpoint e la distribuzione in questo articolo, si presuppone che sia stata registrata la cartella del modello che contiene il modello.

Per registrare il modello di esempio, seguire questa procedura:

Passare ad Azure Machine Learning Studio.
Nella barra di spostamento a sinistra selezionare la pagina Modelli .
Selezionare Registra e quindi scegliere Da file locali.
Selezionare Tipo non specificato per Tipo di modello.
Selezionare Sfoglia e scegliere Sfoglia cartella.
Selezionare la \azureml-examples\cli\endpoints\online\model-1\model cartella dalla copia locale del repository clonato o scaricato in precedenza. Quando richiesto, selezionare Carica e attendere il completamento del caricamento.
Selezionare Avanti al termine del caricamento della cartella.
Immettere un nome descrittivo per il modello. I passaggi descritti in questo articolo presuppongono che il modello sia denominato model-1.
Selezionare Avanti e quindi Registra per completare la registrazione.
Ripetere i passaggi precedenti per registrare un oggetto model-2 dalla \azureml-examples\cli\endpoints\online\model-2\model cartella nella copia locale del repository clonato o scaricato in precedenza.

Per altre informazioni sull'uso dei modelli registrati, vedere Registrare e usare i modelli.

Per informazioni sulla creazione di un ambiente in studio, vedere Creare un ambiente.

Creare un endpoint online gestito e la distribuzione "blu"

Usare il studio di Azure Machine Learning per creare un endpoint online gestito direttamente nel browser. Quando si crea un endpoint online gestito in studio, è necessario definire una distribuzione iniziale. Non è possibile creare un endpoint online gestito vuoto.

Un modo per creare un endpoint online gestito nello studio è dalla pagina Modelli . Questo metodo offre anche un modo semplice per aggiungere un modello a una distribuzione online gestita esistente. Per distribuire il modello denominato model-1 registrato in precedenza nella sezione Registrare il modello :

Passare ad Azure Machine Learning Studio.
Nella barra di spostamento a sinistra selezionare la pagina Modelli .
Selezionare il modello denominato model-1 controllando il cerchio accanto al nome.
Selezionare Distribuisci>endpoint in tempo reale.

Questa azione apre una finestra in cui è possibile specificare i dettagli sull'endpoint.
Immettere un nome endpoint.
Mantenere le selezioni predefinite: gestito per il tipo di calcolo e l'autenticazione basata su chiave per il tipo di autenticazione.
Selezionare Avanti finché non si arriva alla pagina "Distribuzione". Eseguire le attività seguenti:
- Assegnare alla distribuzione il nome "blue".
- Selezionare la casella Abilita la diagnostica e la raccolta dati di Application Insights per consentire di visualizzare i grafici delle attività dell'endpoint in un secondo momento.
Selezionare Avanti per passare alla pagina "Ambiente". In questo caso, seguire questa procedura:
- Nella casella "Selezionare il file di assegnazione dei punteggi e le dipendenze" individuare e selezionare il \azureml-examples\cli\endpoints\online\model-1\onlinescoring\score.py file dal repository clonato o scaricato in precedenza.
- Iniziare a digitare sklearn nella casella di ricerca sopra l'elenco degli ambienti e selezionare l'ambiente curato AzureML-sklearn-0.24 .
Selezionare Avanti per passare alla pagina "Calcolo". In questo caso, mantenere la selezione predefinita per la macchina virtuale "Standard_DS3_v2" e modificare il numero di istanze in 1.
Selezionare Avanti per accettare l'allocazione del traffico predefinita (100%) alla distribuzione blu.
Esaminare le impostazioni di distribuzione e selezionare il pulsante Crea .

In alternativa, è possibile creare un endpoint online gestito dalla pagina Endpoint in studio.

Passare ad Azure Machine Learning Studio.
Nella barra di spostamento a sinistra selezionare la pagina Endpoint .
Seleziona + Crea.

Questa azione apre una finestra per specificare i dettagli relativi all'endpoint e alla distribuzione. Immettere le impostazioni per l'endpoint e la distribuzione come descritto nei passaggi precedenti da 5 a 11, accettando le impostazioni predefinite fino a quando non viene richiesto di creare la distribuzione.

Confermare la distribuzione esistente

Un modo per confermare la distribuzione esistente consiste nel richiamare l'endpoint in modo che possa assegnare un punteggio al modello per una determinata richiesta di input. Quando si richiama l'endpoint tramite l'interfaccia della riga di comando o Python SDK, è possibile scegliere di specificare il nome della distribuzione che riceverà il traffico in ingresso.

Nota

A differenza dell'interfaccia della riga di comando o di Python SDK, studio di Azure Machine Learning richiede di specificare una distribuzione quando si richiama un endpoint.

Richiamare l'endpoint con il nome della distribuzione

Se si richiama l'endpoint con il nome della distribuzione che riceverà il traffico, Azure Machine Learning instrada il traffico dell'endpoint direttamente alla distribuzione specificata e ne restituisce l'output. È possibile usare l'opzione per l'interfaccia --deployment-name della riga di comando v2 o deployment_name l'opzione per SDK v2 per specificare la distribuzione.

Richiamare l'endpoint senza specificare la distribuzione

Se si richiama l'endpoint senza specificare la distribuzione che riceverà il traffico, Azure Machine Learning instrada il traffico in ingresso dell'endpoint alle distribuzioni nell'endpoint in base alle impostazioni di controllo del traffico.

Le impostazioni di controllo del traffico allocano le percentuali di traffico in ingresso a ogni distribuzione nell'endpoint. Ad esempio, se le regole di traffico specificano che una particolare distribuzione nell'endpoint riceverà il traffico in ingresso del 40% del tempo, Azure Machine Learning instrada il 40% del traffico dell'endpoint a tale distribuzione.

È possibile visualizzare lo stato dell'endpoint e della distribuzione esistenti eseguendo:

az ml online-endpoint show --name $ENDPOINT_NAME 

az ml online-deployment show --name blue --endpoint $ENDPOINT_NAME

Verrà visualizzato l'endpoint identificato da $ENDPOINT_NAME e, una distribuzione denominata blue.

Testare l'endpoint con dati di esempio

L'endpoint può essere richiamato usando il invoke comando . Verrà inviata una richiesta di esempio usando un file JSON .

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json

Controllare lo stato per verificare se il modello è stato distribuito senza errori:

ml_client.online_endpoints.get(name=online_endpoint_name)

Testare l'endpoint con dati di esempio

Usando il MLClient creato in precedenza, si otterrà un handle per l'endpoint. L'endpoint può essere richiamato usando il invoke comando con i parametri seguenti:

endpoint_name - Nome dell'endpoint
request_file - File con dati della richiesta
deployment_name - Nome della distribuzione specifica da testare in un endpoint

Verrà inviata una richiesta di esempio usando un file JSON .

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="../model-1/sample-request.json",
)

Ridimensionare la distribuzione esistente per gestire più traffico

Nella distribuzione descritta in Distribuire e assegnare un punteggio a un modello di Machine Learning con un endpoint online, impostare il instance_count valore sul valore 1 nel file yaml di distribuzione. È possibile aumentare il numero di istanze usando il update comando :

az ml online-deployment update --name blue --endpoint-name $ENDPOINT_NAME --set instance_count=2

Nota

Si noti che nel comando precedente viene usato --set per eseguire l'override della configurazione della distribuzione. In alternativa, è possibile aggiornare il file yaml e passarlo come input al update comando usando l'input --file .

Usando il MLClient creato in precedenza, si otterrà un handle per la distribuzione. La distribuzione può essere ridimensionata aumentando o riducendo .instance_count

# scale the deployment
blue_deployment = ml_client.online_deployments.get(
    name="blue", endpoint_name=online_endpoint_name
)
blue_deployment.instance_count = 2
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

Ottenere i dettagli dell'endpoint

# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

Distribuire un nuovo modello, ma non inviarlo ancora al traffico

Creare una nuova distribuzione denominata green:

az ml online-deployment create --name green --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/green-deployment.yml

Poiché non è stato allocato in modo esplicito alcun traffico a green, non è stato allocato alcun traffico. È possibile verificare che usando il comando :

az ml online-endpoint show -n $ENDPOINT_NAME --query traffic

Testare la nuova distribuzione

Anche se green ha allocato il 0% del traffico, è possibile richiamarlo direttamente specificando il --deployment nome:

az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment-name green --request-file endpoints/online/model-2/sample-request.json

Se si vuole usare un client REST per richiamare la distribuzione direttamente senza passare attraverso le regole del traffico, impostare l'intestazione HTTP seguente: azureml-model-deployment: <deployment-name>. Il frammento di codice seguente usa curl per richiamare direttamente la distribuzione. Il frammento di codice deve funzionare negli ambienti Unix/WSL:

# get the scoring uri
SCORING_URI=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query scoring_uri)
# use curl to invoke the endpoint
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --header "azureml-model-deployment: green" --data @endpoints/online/model-2/sample-request.json

Creare una nuova distribuzione per l'endpoint online gestito e denominare la distribuzione green:

# create green deployment
model2 = Model(path="../model-2/model/sklearn_regression_model.pkl")
env2 = Environment(
    conda_file="../model-2/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

green_deployment = ManagedOnlineDeployment(
    name="green",
    endpoint_name=online_endpoint_name,
    model=model2,
    environment=env2,
    code_configuration=CodeConfiguration(
        code="../model-2/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)

# use MLClient to create green deployment
ml_client.online_deployments.begin_create_or_update(green_deployment).result()

Nota

Se si sta creando una distribuzione per un endpoint online Kubernetes, usare la KubernetesOnlineDeployment classe e specificare un tipo di istanza Kubernetes nel cluster Kubernetes.

Testare la nuova distribuzione

Anche se green ha allocato il 0% del traffico, è comunque possibile richiamare l'endpoint e la distribuzione con il file JSON .

ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="green",
    request_file="../model-2/sample-request.json",
)

Creare una nuova distribuzione per aggiungere all'endpoint online gestito e denominare la distribuzione green.

Dalla pagina Dei dettagli dell'endpoint

Selezionare il pulsante + Aggiungi distribuzione nella pagina "Dettagli" dell'endpoint.
Selezionare Distribuisci un modello.
Selezionare Avanti per passare alla pagina "Modello" e selezionare il modello-2.
Selezionare Avanti per passare alla pagina "Distribuzione" ed eseguire le attività seguenti:
1. Denominare la distribuzione "verde".
2. Abilitare la diagnostica e la raccolta dei dati di Application Insights.
Selezionare Avanti per passare alla pagina "Ambiente". In questo caso, seguire questa procedura:
- Nella casella "Selezionare il file di assegnazione dei punteggi e le dipendenze" individuare e selezionare il \azureml-examples\cli\endpoints\online\model-2\onlinescoring\score.py file dal repository clonato o scaricato in precedenza.
- Iniziare a digitare sklearn nella casella di ricerca sopra l'elenco degli ambienti e selezionare l'ambiente curato AzureML-sklearn-0.24 .
Selezionare Avanti per passare alla pagina "Calcolo". In questo caso, mantenere la selezione predefinita per la macchina virtuale "Standard_DS3_v2" e modificare il numero di istanze in 1.
Selezionare Avanti per passare alla pagina "Traffico". In questo caso, mantenere l'allocazione del traffico predefinita alle distribuzioni (il traffico da "blu" al 100% e il traffico verso "verde").
Selezionare Avanti per esaminare le impostazioni di distribuzione.
Selezionare Crea per creare la distribuzione.

In alternativa, è possibile usare la pagina Modelli per aggiungere una distribuzione:

Nella barra di spostamento a sinistra selezionare la pagina Modelli .
Selezionare un modello controllando il cerchio accanto al nome del modello.
Selezionare Distribuisci>endpoint in tempo reale.
Scegliere di eseguire la distribuzione in un endpoint online gestito esistente.
Seguire i passaggi precedenti da 3 a 9 per completare la creazione della distribuzione verde.

Nota

Quando si aggiunge una nuova distribuzione a un endpoint, è possibile modificare il bilanciamento del traffico tra le distribuzioni nella pagina "Traffico". A questo punto, tuttavia, è consigliabile mantenere l'allocazione del traffico predefinita alle distribuzioni (il 100% del traffico verso "blu" e il 0% del traffico verso "verde").

Testare la nuova distribuzione

Anche se green ha allocato il 0% del traffico, è comunque possibile richiamare l'endpoint e la distribuzione. Usare la scheda Test nella pagina dei dettagli dell'endpoint per testare la distribuzione online gestita. Immettere l'input di esempio e visualizzare i risultati.

Selezionare la scheda Test nella pagina dei dettagli dell'endpoint.
Selezionare la distribuzione verde dal menu a discesa.
Copiare l'input di esempio dal file JSON .
Incollare l'input di esempio nella casella di test.
Selezionare Verifica.

Testare la distribuzione con il traffico con mirroring

Dopo aver testato la green distribuzione, è possibile eseguire il mirroring (o copiare) una percentuale del traffico attivo verso di esso. Il mirroring del traffico (detto anche shadowing) non modifica i risultati restituiti ai client. Le richieste continuano a passare al 100% alla blue distribuzione. La percentuale di mirroring del traffico viene copiata e inviata alla green distribuzione in modo da poter raccogliere metriche e registrazione senza influire sui client. Il mirroring è utile quando si vuole convalidare una nuova distribuzione senza influire sul client. Ad esempio, è possibile usare il mirroring per verificare se la latenza si trova all'interno di limiti accettabili o per verificare che non siano presenti errori HTTP. Il test della nuova distribuzione con mirroring/shadowing del traffico è noto anche come shadow testing. La distribuzione che riceve il traffico con mirroring (in questo caso, la green distribuzione) può anche essere chiamata distribuzione shadow.

Il mirroring presenta le limitazioni seguenti:

Il mirroring è supportato per l'interfaccia della riga di comando (versione 2.4.0 o successiva) e Python SDK (v2) (versione 1.0.0 o successiva). Se si usa una versione precedente dell'interfaccia della riga di comando o dell'SDK per aggiornare un endpoint, si perderà l'impostazione del traffico mirror.
Il mirroring non è attualmente supportato per gli endpoint online kubernetes.
È possibile eseguire il mirroring del traffico a una sola distribuzione in un endpoint.
La percentuale massima di traffico che è possibile eseguire il mirroring è del 50%. Questo limite consiste nel ridurre l'effetto sulla quota di larghezza di banda dell'endpoint (predefinito 5 MBPS): la larghezza di banda dell'endpoint viene limitata se si supera la quota allocata. Per informazioni sul monitoraggio della limitazione della larghezza di banda, vedere Monitorare gli endpoint online gestiti.

Si notino anche i comportamenti seguenti:

Una distribuzione può essere configurata per ricevere solo il traffico live o il traffico con mirroring, non entrambi.
Quando si richiama un endpoint, è possibile specificare il nome di una delle relative distribuzioni, anche una distribuzione shadow, per restituire la stima.
Quando si richiama un endpoint con il nome della distribuzione che riceverà il traffico in ingresso, Azure Machine Learning non eseguirà il mirroring del traffico verso la distribuzione shadow. Azure Machine Learning riflette il traffico verso la distribuzione shadow dal traffico inviato all'endpoint quando non si specifica una distribuzione.

Impostare ora la distribuzione verde per ricevere il 10% del traffico con mirroring. I client riceveranno comunque stime solo dalla distribuzione blu.

Diagram showing 10% traffic mirrored to one deployment.

Il comando seguente rispecchia il 10% del traffico verso la green distribuzione:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=10"

È possibile testare il traffico mirror richiamando l'endpoint più volte senza specificare una distribuzione per ricevere il traffico in ingresso:

for i in {1..20} ; do
    az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
done

È possibile verificare che la percentuale specifica del traffico sia stata inviata alla green distribuzione visualizzando i log dalla distribuzione:

az ml online-deployment get-logs --name blue --endpoint $ENDPOINT_NAME

Dopo il test, è possibile impostare il traffico mirror su zero per disabilitare il mirroring:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=0"

Il comando seguente rispecchia il 10% del traffico verso la green distribuzione:

endpoint.mirror_traffic = {"green": 10}
ml_client.begin_create_or_update(endpoint).result()

È possibile testare il traffico mirror richiamando l'endpoint più volte senza specificare una distribuzione per ricevere il traffico in ingresso:

# You can test mirror traffic by invoking the endpoint several times
for i in range(20):
    ml_client.online_endpoints.invoke(
        endpoint_name=online_endpoint_name,
        request_file="../model-1/sample-request.json",
    )

È possibile verificare che la percentuale specifica del traffico sia stata inviata alla green distribuzione visualizzando i log dalla distribuzione:

ml_client.online_deployments.get_logs(
    name="green", endpoint_name=online_endpoint_name, lines=50
)

Dopo il test, è possibile impostare il traffico mirror su zero per disabilitare il mirroring:

endpoint.mirror_traffic = {"green": 0}
ml_client.begin_create_or_update(endpoint).result()

Per eseguire il mirroring del 10% del traffico verso la green distribuzione:

Nella pagina Dettagli endpoint selezionare Aggiorna traffico.
Scorrere il pulsante per abilitare il traffico con mirroring.
Selezionare la distribuzione verde nel menu a discesa "Nome distribuzione".
Mantenere l'allocazione del traffico predefinita del 10%.
Selezionare Aggiorna.

La pagina dei dettagli dell'endpoint mostra ora l'allocazione del traffico con mirroring del 10% alla green distribuzione.

Per testare il traffico con mirroring, vedere le schede dell'interfaccia della riga di comando di Azure o Python per richiamare l'endpoint più volte. Verificare che la percentuale specifica del traffico sia stata inviata alla green distribuzione visualizzando i log dalla distribuzione. È possibile accedere ai log di distribuzione dalla scheda Log di distribuzione dell'endpoint. È anche possibile usare metriche e log per monitorare le prestazioni del traffico con mirroring. Per altre informazioni, vedere Monitorare gli endpoint online.

Dopo il test, è possibile disabilitare il mirroring:

Nella pagina Dettagli endpoint selezionare Aggiorna traffico.
Scorrere il pulsante accanto a Abilita il traffico con mirroring per disabilitare il traffico con mirroring.
Selezionare Aggiorna.

Allocare una piccola percentuale di traffico attivo alla nuova distribuzione

Dopo aver testato la green distribuzione, allocare una piccola percentuale di traffico a tale distribuzione:

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=90 green=10"

Dopo aver testato la green distribuzione, allocare una piccola percentuale di traffico a tale distribuzione:

endpoint.traffic = {"blue": 90, "green": 10}
ml_client.begin_create_or_update(endpoint).result()

Suggerimento

La percentuale di traffico totale deve sommare al 0% (per disabilitare il traffico) o al 100% (per abilitare il traffico).

green La distribuzione riceve ora il 10% di tutto il traffico live. I client riceveranno stime sia dalle distribuzioni che dalle bluegreen distribuzioni.

Diagram showing traffic split between deployments.

Inviare tutto il traffico alla nuova distribuzione

Dopo aver soddisfatto completamente la green distribuzione, passare tutto il traffico a esso.

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=0 green=100"

Dopo aver soddisfatto completamente la green distribuzione, passare tutto il traffico a esso.

endpoint.traffic = {"blue": 0, "green": 100}
ml_client.begin_create_or_update(endpoint).result()

Rimuovere la distribuzione precedente

Usare la procedura seguente per eliminare una singola distribuzione da un endpoint online gestito. L'eliminazione di una singola distribuzione influisce sulle altre distribuzioni nell'endpoint online gestito:

az ml online-deployment delete --name blue --endpoint $ENDPOINT_NAME --yes --no-wait

ml_client.online_deployments.begin_delete(
    name="blue", endpoint_name=online_endpoint_name
).wait()

Eliminare l'endpoint e la distribuzione

Se non si intende usare l'endpoint e la distribuzione, è necessario eliminarli. Eliminando l'endpoint, verranno eliminate anche tutte le distribuzioni sottostanti.

az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait

Se non si intende usare l'endpoint e la distribuzione, è necessario eliminarli. Eliminando l'endpoint, verranno eliminate anche tutte le distribuzioni sottostanti.

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

Eseguire l'implementazione sicura delle nuove distribuzioni per l'inferenza in tempo reale

Prerequisiti

Preparare il sistema

Impostare le variabili di ambiente

Clonare il repository di esempi

Clonare il repository di esempi

Connessione all'area di lavoro di Azure Machine Learning

Clonare il repository di esempi

Scaricare i file dal repository di esempi

Definire l'endpoint e la distribuzione

Definire un endpoint

Definire una distribuzione

Creare un endpoint online

Creare la distribuzione "blue"

Creare un endpoint online

Creare la distribuzione "blue"

Registrare il modello

Creare un endpoint online gestito e la distribuzione "blu"

Confermare la distribuzione esistente

Richiamare l'endpoint con il nome della distribuzione

Richiamare l'endpoint senza specificare la distribuzione

Testare l'endpoint con dati di esempio

Testare l'endpoint con dati di esempio

Visualizzare gli endpoint online gestiti

Testare l'endpoint con dati di esempio

Ridimensionare la distribuzione esistente per gestire più traffico

Ottenere i dettagli dell'endpoint

Distribuire un nuovo modello, ma non inviarlo ancora al traffico

Testare la nuova distribuzione

Testare la nuova distribuzione

Testare la nuova distribuzione

Testare la distribuzione con il traffico con mirroring

Allocare una piccola percentuale di traffico attivo alla nuova distribuzione

Inviare tutto il traffico alla nuova distribuzione

Rimuovere la distribuzione precedente

Eliminare l'endpoint e la distribuzione

Risorse aggiuntive

Eseguire l'implementazione sicura delle nuove distribuzioni per l'inferenza in tempo reale

Prerequisiti

Preparare il sistema

Impostare le variabili di ambiente

Clonare il repository di esempi

Definire l'endpoint e la distribuzione

Definire un endpoint

Definire una distribuzione

Creare un endpoint online

Creare la distribuzione "blue"

Confermare la distribuzione esistente

Richiamare l'endpoint con il nome della distribuzione

Richiamare l'endpoint senza specificare la distribuzione

Testare l'endpoint con dati di esempio

Ridimensionare la distribuzione esistente per gestire più traffico

Distribuire un nuovo modello, ma non inviarlo ancora al traffico

Testare la nuova distribuzione

Testare la distribuzione con il traffico con mirroring

Allocare una piccola percentuale di traffico attivo alla nuova distribuzione

Inviare tutto il traffico alla nuova distribuzione

Rimuovere la distribuzione precedente

Eliminare l'endpoint e la distribuzione

Contenuto correlato

Risorse aggiuntive