Eseguire l'implementazione sicura delle nuove distribuzioni per l'inferenza in tempo reale

2025-05-02

SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)

In questo articolo viene illustrato come distribuire una nuova versione di un modello di Machine Learning nell'ambiente di produzione senza causare interruzioni. Si usa una strategia di distribuzione blu-verde, nota anche come strategia di implementazione sicura, per introdurre una nuova versione di un servizio Web nell'ambiente di produzione. Quando si usa questa strategia, è possibile implementare la nuova versione del servizio Web in un piccolo subset di utenti o richieste prima di implementarla completamente.

Questo articolo presuppone l'uso di endpoint online o endpoint usati per l'inferenza online (in tempo reale). Esistono due tipi di endpoint online: endpoint online gestiti ed endpoint online Kubernetes. Per altre informazioni sugli endpoint e sulle differenze tra i tipi di endpoint, vedere Endpoint online gestiti e endpoint online Kubernetes.

Questo articolo usa endpoint online gestiti per la distribuzione. Ma include anche note che spiegano come usare gli endpoint Kubernetes anziché gli endpoint online gestiti.

In questo articolo viene illustrato come:

Definire un endpoint online con una distribuzione denominata blue per gestire la prima versione di un modello.
Ridimensionare la blue distribuzione in modo che possa gestire più richieste.
Distribuire la seconda versione del modello, denominata green distribuzione, all'endpoint, ma non inviare alcun traffico attivo alla distribuzione.
Testare la green distribuzione da sola.
Eseguire il mirroring di una percentuale di traffico attivo verso la green distribuzione per convalidarla.
Invia una piccola percentuale di traffico attivo alla distribuzione green.
Invia tutto il traffico in diretta alla distribuzione green.
Eliminare l'implementazione inutilizzata blue.

Prerequisiti

L'interfaccia della riga di comando di Azure e l'estensione per l'interfaccia ml della riga di comando di Azure, installata e configurata. Per altre informazioni, vedere Installare e configurare l'interfaccia della riga di comando (v2).
Una shell Bash o una shell compatibile, ad esempio una shell in un sistema Linux o un sottosistema Windows per Linux. Gli esempi dell'interfaccia della riga di comando di Azure in questo articolo presuppongono l'uso di questo tipo di shell.
Un'area di lavoro di Azure Machine Learning. Per istruzioni su come creare un'area di lavoro, vedere Configurare.

Un account utente che possiede almeno uno dei ruoli di controllo degli accessi di Azure RBAC seguenti:
- Ruolo proprietario per l'area di lavoro di Azure Machine Learning
- Ruolo Collaboratore per l'area di lavoro di Azure Machine Learning
- Ruolo personalizzato con Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* autorizzazioni
Per altre informazioni, vedere Gestire l'accesso alle aree di lavoro di Azure Machine Learning.
Facoltativamente, motore Docker, installato ed in esecuzione in locale. Questo prerequisito è altamente consigliato. È necessario per distribuire un modello in locale ed è utile per il debug.

SI APPLICA A: Python SDK azure-ai-ml v2 (corrente)

Un'area di lavoro di Azure Machine Learning. Per i passaggi per la creazione di un'area di lavoro, vedere Creare l'area di lavoro.
Azure Machine Learning SDK per Python v2. Per installare l'SDK, usare il comando seguente:
```
pip install azure-ai-ml azure-identity
```
Per aggiornare un'installazione esistente di SDK alla versione più recente, usare il comando seguente:
```
pip install --upgrade azure-ai-ml azure-identity
```
Per altre informazioni, vedere Libreria client del pacchetto di Azure Machine Learning per Python.

Un account utente con almeno uno dei seguenti ruoli di controllo degli accessi basati su ruoli di Azure (RBAC di Azure):
- Ruolo proprietario per l'area di lavoro di Azure Machine Learning
- Ruolo Collaboratore per l'area di lavoro di Azure Machine Learning
- Ruolo personalizzato con Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* autorizzazioni
Per altre informazioni, vedere Gestire l'accesso alle aree di lavoro di Azure Machine Learning.
Facoltativamente, motore Docker, installato ed in esecuzione in locale. Questo prerequisito è altamente consigliato. È necessario per distribuire un modello in locale ed è utile per il debug.

Una sottoscrizione di Azure. Se non si ha una sottoscrizione di Azure, creare un account gratuito prima di iniziare.
Un'area di lavoro di Azure Machine Learning. Per istruzioni sulla creazione di un'area di lavoro, vedere Creare l'area di lavoro.
Un account utente con almeno uno dei seguenti ruoli di Azure RBAC (controllo degli accessi in base al ruolo):
- Ruolo proprietario per l'area di lavoro di Azure Machine Learning
- Ruolo Collaboratore per l'area di lavoro di Azure Machine Learning
- Ruolo personalizzato con Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* autorizzazioni
Per altre informazioni, vedere Gestire l'accesso alle aree di lavoro di Azure Machine Learning.

Preparare il sistema

Impostare le variabili di ambiente

È possibile configurare i valori predefiniti da usare con l'interfaccia della riga di comando di Azure. Per evitare di passare più volte valori per la sottoscrizione, l'area di lavoro e il gruppo di risorse, eseguire il codice seguente:

az account set --subscription <subscription-ID>
az configure --defaults workspace=<Azure-Machine-Learning-workspace-name> group=<resource-group-name>

Clonare il repository di esempi

Per seguire questo articolo, clonare prima il repository degli esempi (azureml-examples). Passare quindi alla directory del cli/ repository:

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples
cd cli

Suggerimento

Usare --depth 1 per clonare solo il commit più recente nel repository, riducendo il tempo necessario per completare l'operazione.

I comandi di questa esercitazione si trovano nel file deploy-safe-rollout-online-endpoints.sh nella directory cli, e i file di configurazione YAML si trovano nella sottodirectory endpoints/online/managed/sample/.

Nota

I file di configurazione YAML per gli endpoint online Kubernetes si trovano nella sottodirectory endpoints/online/kubernetes/.

Clonare il repository di esempi

Prima di eseguire gli esempi di training, clonare il repository degli esempi (azureml-examples). Passare quindi alla directory azureml-examples/sdk/python/endpoints/online/managed:

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/sdk/python/endpoints/online/managed

Suggerimento

Usare --depth 1 per clonare solo il commit più recente nel repository, riducendo il tempo necessario per completare l'operazione.

Le informazioni contenute in questo articolo si basano sul notebook online-endpoints-safe-rollout.ipynb. Questo articolo contiene lo stesso contenuto del notebook, ma l'ordine dei blocchi di codice è leggermente diverso tra i due documenti.

Nota

I passaggi per l'endpoint online Kubernetes si basano sul notebook kubernetes-online-endpoints-safe-rollout.ipynb.

Connettersi a un'area di lavoro di Azure Machine Learning

L'area di lavoro è la risorsa di primo livello per Azure Machine Learning. Un'area di lavoro offre una posizione centralizzata per lavorare con tutti gli artefatti creati quando si usa Azure Machine Learning. In questa sezione ci si connette all'area di lavoro in cui si eseguono attività di distribuzione. Per seguire questa procedura, aprire il notebook online-endpoints-safe-rollout.ipynb.

Importare le librerie necessarie:

# import required libraries
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    Model,
    Environment,
    CodeConfiguration,
)
from azure.identity import DefaultAzureCredential

Nota

Se si utilizza un endpoint online Kubernetes, importare la classe KubernetesOnlineEndpoint e la classe KubernetesOnlineDeployment dalla libreria azure.ai.ml.entities.

Configurare le impostazioni dell'area di lavoro e ottenere un handle per l'area di lavoro:

Per connettersi a un'area di lavoro, sono necessari parametri di identificatore, ovvero una sottoscrizione, un gruppo di risorse e un nome dell'area di lavoro. Queste informazioni vengono usate nella MLClient classe dal azure.ai.ml modulo per ottenere un handle per l'area di lavoro di Azure Machine Learning necessaria. In questo esempio si usa l'autenticazione di Azure predefinita.
```
# enter details of your AML workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AML_WORKSPACE_NAME>"
```
```
# get a handle to the workspace
ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)
```

Se Git è installato nel computer locale, è possibile seguire le istruzioni per clonare il repository degli esempi. In caso contrario, seguire le istruzioni per scaricare i file dal repository degli esempi.

Clonare il repository di esempi

Per seguire questo articolo, clonare il repository azureml-examples e quindi passare alla cartella azureml-examples/cli/endpoints/online/model-1.

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/cli/endpoints/online/model-1

Suggerimento

Usare --depth 1 per clonare solo il commit più recente nel repository, riducendo il tempo necessario per completare l'operazione.

Scaricare i file dal repository degli esempi

Anziché clonare il repository di esempi, è possibile scaricare il repository nel computer locale:

Vai a https://github.com/Azure/azureml-examples/.
Selezionare <> Codice e quindi passare alla scheda Locale e selezionare Scarica ZIP.

Definire l'endpoint e la distribuzione

Gli endpoint online sono usati per l'inferenza online (in tempo reale). Gli endpoint online contengono distribuzioni pronte a ricevere dati dai client e in grado di inviare risposte in tempo reale.

Definire un endpoint

Nella tabella seguente sono elencati gli attributi chiave da specificare quando si definisce un endpoint.

Attributo	Obbligatorio o facoltativo	Descrizione
Nome	Obbligatorio	Nome dell'endpoint. Deve essere univoco nell'area di Azure. Per altre informazioni sulle regole di denominazione, vedere Endpoint online e endpoint batch di Azure Machine Learning.
Modalità di autenticazione	Opzionale	Metodo di autenticazione per l'endpoint. È possibile scegliere tra l'autenticazione basata su chiave, `key`e l'autenticazione basata su token di Azure Machine Learning, `aml_token`. Una chiave non scade, a differenza di un token. Per altre informazioni sull'autenticazione, vedere Autenticare i client per gli endpoint online.
Descrizione	Opzionale	Descrizione dell'endpoint.
Tag	Opzionale	Dizionario di tag per l'endpoint.
Traffico	Opzionale	Regole su come instradare il traffico tra le distribuzioni. Il traffico viene rappresentato come dizionario di coppie chiave-valore, in cui la chiave rappresenta il nome della distribuzione e il valore rappresenta la percentuale di traffico verso tale distribuzione. È possibile impostare il traffico solo dopo la creazione delle distribuzioni in un endpoint. È anche possibile aggiornare il traffico per un endpoint online dopo la creazione delle distribuzioni. Per ulteriori informazioni su come utilizzare il traffico duplicato, consultare Allocare una piccola percentuale di traffico attivo alla nuova distribuzione.
Mirroring del traffico	Opzionale	Percentuale di traffico attivo da utilizzare nella distribuzione. Per ulteriori informazioni su come utilizzare il traffico replicato, consulta Testare la distribuzione con il traffico replicato.

Per visualizzare un elenco completo degli attributi che è possibile specificare quando si crea un endpoint, vedere Schema YAML dell'endpoint online dell'interfaccia della riga di comando (v2). Per la versione 2 di Azure Machine Learning SDK per Python, vedere Classe ManagedOnlineEndpoint.

Definire una distribuzione

Un'implementazione è un insieme di risorse necessarie per ospitare il modello che esegue la deduzione effettiva. Nella tabella seguente vengono descritti gli attributi chiave da specificare quando si definisce una distribuzione.

Attributo	Obbligatorio o facoltativo	Descrizione
Nome	Obbligatorio	Nome della distribuzione.
Nome endpoint	Obbligatorio	Nome dell'endpoint in cui creare la distribuzione.
Modello	Opzionale	Modello da usare per la distribuzione. Questo valore può essere un riferimento a un modello con controllo delle versioni esistente nell'area di lavoro o a una specifica del modello inline. Negli esempi di questo articolo un modello esegue la `scikit-learn` regressione.
Percorso del codice	Opzionale	Percorso della cartella nell'ambiente di sviluppo locale che contiene tutto il codice sorgente Python per l'assegnazione del punteggio al modello. È possibile usare directory e pacchetti annidati.
Scoring script (Script di assegnazione punteggi)	Opzionale	Codice Python che esegue il modello in una determinata richiesta di input. Questo valore può essere il percorso relativo del file di assegnazione dei punteggi nella cartella del codice sorgente. Lo script di assegnazione dei punteggi riceve i dati inviati a un servizio Web distribuito e lo passa al modello. Quindi, lo script esegue il modello e restituisce la risposta al client. Lo script di assegnazione dei punteggi è specifico del modello e deve comprendere i dati che il modello prevede come input e restituisce come output. Gli esempi di questo articolo usano un file score.py. Questo codice Python deve avere una funzione `init` e una funzione `run`. La `init` funzione viene chiamata dopo la creazione o l'aggiornamento del modello. È possibile utilizzarlo, ad esempio, per memorizzare il modello nella cache in memoria. La funzione `run` viene chiamata a ogni chiamata dell'endpoint per eseguire l'assegnazione del punteggio e la stima effettive.
Ambiente	Obbligatorio	Ambiente in cui ospitare il modello e il codice. Questo valore può essere un riferimento a un ambiente con controllo delle versioni esistente nell'area di lavoro o a una specifica dell'ambiente inline. L'ambiente può essere un'immagine Docker con dipendenze Conda, un Dockerfile o un ambiente registrato.
Tipo di istanza	Obbligatorio	Dimensioni della macchina virtuale da usare per la distribuzione. Per un elenco delle dimensioni supportate, vedere Elenco di SKU degli endpoint online gestiti.
Numero di istanze	Obbligatorio	Numero di istanze da usare per la distribuzione. Si basa il valore sul carico di lavoro previsto. Per l'alta disponibilità, raccomandiamo di utilizzare almeno tre istanze. Azure Machine Learning riserva un ulteriore 20% per l'esecuzione degli aggiornamenti. Per ulteriori informazioni, consultare gli endpoint online e gli endpoint batch di Azure Machine Learning.

Per visualizzare un elenco completo degli attributi che è possibile specificare quando si crea una distribuzione, vedere Schema YAML della distribuzione online gestita dell'interfaccia della riga di comando (v2). Per la versione 2 di Python SDK, vedere Classe ManagedOnlineDeployment.

Creare un endpoint online

Impostare prima il nome dell'endpoint e quindi configurarlo. In questo articolo si usa il file endpoints/online/managed/sample/endpoint.yml per configurare l'endpoint. Il file contiene le righe seguenti:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

Nella tabella seguente vengono descritte le chiavi usate dal formato YAML dell'endpoint. Per informazioni su come specificare questi attributi, vedere lo schema YAML dell'endpoint online per la CLI (v2). Per informazioni sui limiti correlati agli endpoint online gestiti, vedere Endpoint online e endpoint batch di Azure Machine Learning.

Chiave	Descrizione
`$schema`	(Facoltativo) Schema YAML. Per visualizzare tutte le opzioni disponibili nel file YAML, è possibile visualizzare lo schema nel blocco di codice precedente in un browser.
`name`	Nome dell'endpoint.
`auth_mode`	Modalità di autenticazione. Usare `key` per l'autenticazione basata su chiave. Usare `aml_token` per l'autenticazione basata su token di Azure Machine Learning. Per ottenere il token più recente, usare il comando `az ml online-endpoint get-credentials`.

Per creare un endpoint online:

Impostare il nome dell'endpoint eseguendo il comando Unix seguente. Sostituire YOUR_ENDPOINT_NAME con un nome univoco.
```
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
```
Importante

I nomi degli endpoint devono essere univoci nell’area di Azure. Ad esempio, nell’area di Azure westus2 può esistere un solo endpoint denominato my-endpoint.
Creare l'endpoint nel cloud eseguendo il codice seguente. Questo codice usa il file endpoint.yml per configurare l'endpoint:
```
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/managed/sample/endpoint.yml
```

Creare l'implementazione blu

È possibile usare il file endpoints/online/managed/sample/blue-deployment.yml per configurare gli aspetti chiave di una distribuzione denominata blue. Il file contiene le righe seguenti:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: blue
endpoint_name: my-endpoint
model:
  path: ../../model-1/model/
code_configuration:
  code: ../../model-1/onlinescoring/
  scoring_script: score.py
environment: 
  conda_file: ../../model-1/environment/conda.yaml
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu22.04:latest
instance_type: Standard_DS3_v2
instance_count: 1

Per utilizzare il file blue-deployment.yml per creare la distribuzione per l'endpoint blue, eseguire il comando seguente:

az ml online-deployment create --name blue --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/blue-deployment.yml --all-traffic

Importante

Il flag --all-traffic nel comando az ml online-deployment create alloca 100 percento del traffico dell'endpoint alla blue distribuzione appena creata.

Nel file blue-deployment.yaml la path riga specifica da dove caricare i file. L'interfaccia della riga di comando di Azure Machine Learning usa queste informazioni per caricare i file e registrare il modello e l'ambiente. Come procedura consigliata per l'ambiente di produzione, è necessario registrare il modello e l'ambiente e specificare il nome e la versione registrati separatamente nel codice YAML. Usare il formato model: azureml:<model-name>:<model-version> per il modello, model: azureml:my-model:1ad esempio . Per l'ambiente, usare il formato environment: azureml:<environment-name>:<environment-version>, ad esempio environment: azureml:my-env:1.

Per la registrazione, è possibile estrarre le definizioni YAML di model e environment in file YAML separati e usare i comandi az ml model create e az ml environment create. Per altre informazioni su questi comandi, eseguire az ml model create -h e az ml environment create -h.

Per altre informazioni sulla registrazione del modello come asset, vedere Registrare un modello usando l'interfaccia della riga di comando di Azure o Python SDK. Per altre informazioni sulla creazione di un ambiente, vedere Creare un ambiente personalizzato.

Creare un endpoint online

Per creare un endpoint online gestito, usare la classe ManagedOnlineEndpoint. Questa classe consente di configurare gli aspetti chiave dell'endpoint.

Configurare l'endpoint:

# Creating a unique endpoint name with current datetime to avoid conflicts
import random

online_endpoint_name = "endpt-moe-" + str(random.randint(0, 10000))

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint",
    auth_mode="key",
    tags={"foo": "bar"},
)

Nota

Per creare un endpoint online Kubernetes, usare la classe KubernetesOnlineEndpoint.

Creare l'endpoint:

ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Creare l'implementazione blu

Per creare una distribuzione per un endpoint online gestito, usare la classe ManagedOnlineDeployment. Questa classe consente di configurare gli aspetti chiave della distribuzione.

Configurare l'implementazione blue:
```
# create blue deployment
model = Model(path="../model-1/model/sklearn_regression_model.pkl")
env = Environment(
    conda_file="../model-1/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    code_configuration=CodeConfiguration(
        code="../model-1/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)
```
In questo esempio, il path parametro specifica da dove caricare i file. Python SDK usa queste informazioni per caricare i file e registrare il modello e l'ambiente. Come procedura consigliata per la produzione, è necessario registrare il modello e l'ambiente e specificare il nome e la versione registrati separatamente nel codice.

Per altre informazioni sulla registrazione del modello come asset, vedere Registrare un modello usando l'interfaccia della riga di comando di Azure o Python SDK.

Per altre informazioni sulla creazione di un ambiente, vedere Creare un ambiente personalizzato.

Nota

Per creare una distribuzione per un endpoint online Kubernetes, usare la classe KubernetesOnlineDeployment.

Creare la distribuzione:

ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Quando si crea un endpoint online gestito in Azure Machine Learning Studio, è necessario definire una distribuzione iniziale per l'endpoint. Prima di poter definire una distribuzione, è necessario disporre di un modello registrato nell'area di lavoro. La sezione seguente illustra come registrare un modello da usare per la distribuzione.

Registrare il modello

Una registrazione del modello è un'entità logica nell'area di lavoro. Questa entità può contenere un singolo file di modello o una directory di più file. Come procedura consigliata per la produzione, è necessario registrare il modello e l'ambiente.

Per registrare il modello di esempio, seguire questa procedura nelle sezioni seguenti.

Caricare i file del modello

Passare ad Azure Machine Learning Studio.
Selezionare Modelli.
Selezionare Registra e quindi Selezionare Da file locali.
In Tipo di modello selezionare Tipo non specificato.
Selezionare Sfoglia e quindi sfoglia cartella.
Passare alla copia locale del repository clonato o scaricato in precedenza e quindi selezionare \azureml-examples\cli\endpoints\online\model-1\model. Quando richiesto, selezionare Carica e attendere il completamento del caricamento.
Seleziona Avanti.

Configurare e registrare il modello

Nella pagina Impostazioni modello immettere un nome descrittivo per il modello in Nome. I passaggi descritti in questo articolo presuppongono che il modello sia denominato model-1.
Selezionare Avanti e quindi Registra per completare la registrazione.

Per esempi successivi in questo articolo, è anche necessario registrare un modello dalla cartella \azureml-examples\cli\endpoints\online\model-2\model nella copia locale del repository. Per registrare il modello, ripetere i passaggi nelle due sezioni precedenti, ma denominare il modello model-2.

Per altre informazioni sull'uso dei modelli registrati, vedere Usare modelli registrati in Azure Machine Learning.

Per informazioni sulla creazione di un ambiente in Studio, vedere Creare un ambiente.

Creare un endpoint online gestito e una distribuzione blu

È possibile usare Azure Machine Learning Studio per creare un endpoint online gestito direttamente nel browser. Quando si crea un endpoint online gestito in Studio, è necessario definire una distribuzione iniziale. Non è possibile creare un endpoint online gestito vuoto.

Un modo per creare un endpoint online gestito in Studio è dalla pagina Modelli. Questo metodo offre anche un modo semplice per aggiungere un modello a una distribuzione online gestita esistente. Per distribuire il modello denominato model-1 registrato in precedenza nella sezione Registrare il modello , seguire questa procedura nelle sezioni seguenti.

Seleziona un modello

Passare ad Azure Machine Learning Studio e quindi selezionare Modelli.
Nell'elenco selezionare il model-1 modello.
Selezionare Distribuisci>Endpoint in tempo reale.

Verrà visualizzata una finestra che è possibile usare per specificare informazioni dettagliate sull'endpoint.

Configurare le impostazioni iniziali

In Nome endpoint immettere un nome per l'endpoint.
Sotto Tipo di calcolo, mantenere il valore predefinito di Gestito.
In Tipo di autenticazione mantenere il valore predefinito dell'autenticazione basata su chiave.
Selezionare Avanti e quindi nella pagina Modello selezionare Avanti.

Configurare le impostazioni rimanenti e creare la distribuzione

Nella pagina Distribuzione seguire questa procedura:
1. Sotto Nome distribuzione, immettere blu.
2. Se vuoi visualizzare i grafici delle attività dei tuoi endpoint nel contesto dello studio in un secondo momento:
  1. In Raccolta dati per inferenza, attivare l'interruttore.
  2. Nella sezione Diagnostica di Application Insights, attivare il toggle.
3. Seleziona Avanti.
Nella pagina Codice e ambiente per l'inferenza seguire questa procedura:
1. In Seleziona uno script di punteggio per l'inferenza, seleziona Sfoglia e poi seleziona il file \azureml-examples\cli\endpoints\online\model-1\onlinescoring\score.py dal repository che hai clonato o scaricato in precedenza.
2. Nella casella di ricerca sopra l'elenco degli ambienti, inizia a immettere sklearn e quindi seleziona l'ambiente selezionato sklearn-1.5:19.
3. Seleziona Avanti.
Nella pagina Calcolo seguire questa procedura:
1. In Macchina virtuale mantenere il valore predefinito.
2. In Numero di istanze sostituire il valore predefinito con 1.
3. Seleziona Avanti.
Nella pagina Traffico in tempo reale, selezionare Avanti per accettare l'allocazione del traffico predefinita del 100% alla blue distribuzione.
Nella pagina Verifica esaminare le impostazioni di distribuzione e quindi selezionare Crea.

Creare un endpoint dalla pagina Endpoint

In alternativa, è possibile creare un endpoint online gestito dalla pagina Endpoint in Studio.

Passare ad Azure Machine Learning Studio.
Seleziona Endpoints.
Fare clic su Crea.

Verrà visualizzata una finestra che è possibile usare per specificare informazioni dettagliate sull'endpoint e sulla distribuzione.
Selezionare un modello e quindi selezionare Seleziona.
Immettere le impostazioni per l'endpoint e la distribuzione come descritto nelle due sezioni precedenti. In ogni passaggio usare i valori predefiniti e nell'ultimo passaggio selezionare Crea per creare la distribuzione.

Confermare la distribuzione esistente

Un modo per confermare la distribuzione esistente consiste nel richiamare l'endpoint in modo che possa assegnare un punteggio al modello per una determinata richiesta di input. Quando si richiama l'endpoint tramite l'interfaccia della riga di comando di Azure o Python SDK, è possibile scegliere di specificare il nome della distribuzione per ricevere il traffico in ingresso.

Nota

A differenza dell'interfaccia della riga di comando di Azure o di Python SDK, Azure Machine Learning Studio richiede di specificare una distribuzione quando si richiama un endpoint.

Richiamare un endpoint con un nome di distribuzione

Quando si richiama un endpoint, è possibile specificare il nome di un'implementazione a cui si desidera indirizzare il traffico. In questo caso, Azure Machine Learning instrada il traffico dell'endpoint direttamente alla distribuzione specificata e ne restituisce l'output. È possibile usare l'opzione --deployment-nameper l'interfaccia della riga di comando di Azure Machine Learning v2 o l'opzione deployment_nameper Python SDK v2 per specificare la distribuzione.

Richiamare l'endpoint senza specificare una distribuzione

Se si richiama l'endpoint senza specificare la distribuzione a cui si desidera inviare traffico, Azure Machine Learning instrada il traffico in ingresso dell'endpoint verso le distribuzioni presenti nell'endpoint in base alle impostazioni di controllo del traffico.

Le impostazioni di controllo del traffico allocano le percentuali di traffico in ingresso a ogni distribuzione nell'endpoint. Ad esempio, se le regole di traffico specificano che una particolare distribuzione nell'endpoint deve ricevere il traffico in ingresso il 40% del tempo, Azure Machine Learning instrada il 40% del traffico dell'endpoint a tale distribuzione.

Per visualizzare lo stato dell'endpoint e della distribuzione esistenti, eseguire i comandi seguenti:

az ml online-endpoint show --name $ENDPOINT_NAME 

az ml online-deployment show --name blue --endpoint $ENDPOINT_NAME

L'output elenca le informazioni sull'endpoint $ENDPOINT_NAME e sulla blue distribuzione.

Testare l'endpoint usando dati di esempio

È possibile richiamare l'endpoint usando il invoke comando . Il comando seguente usa il file JSONsample-request.json per inviare una richiesta di esempio:

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json

Usare il codice seguente per controllare lo stato della distribuzione del modello:

ml_client.online_endpoints.get(name=online_endpoint_name)

Testare l'endpoint usando dati di esempio

È possibile usare l'istanza di MLClient creata in precedenza per ottenere un handle all'endpoint. Per richiamare l'endpoint, è possibile usare il invoke comando con i parametri seguenti:

endpoint_name: nome dell'endpoint
request_file: file contenente i dati della richiesta
deployment_name: nome di una distribuzione da testare nell'endpoint

Il codice seguente usa il file JSONsample-request.json per inviare una richiesta di esempio.

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="../model-1/sample-request.json",
)

Visualizzare gli endpoint online gestiti

È possibile visualizzare tutti gli endpoint online gestiti nella pagina endpoint di Studio. La scheda Dettagli della pagina di ogni endpoint visualizza informazioni critiche, ad esempio l'URI dell'endpoint, lo stato, gli strumenti di test, i monitoraggi attività, i log di distribuzione e il codice di utilizzo di esempio. Per visualizzare queste informazioni, seguire questa procedura:

In Studio selezionare Endpoint. Viene visualizzato un elenco di tutti gli endpoint nell'area di lavoro.
Facoltativamente, creare un filtro per il tipo di istanza di calcolo per visualizzare solo i tipi gestiti.
Selezionare un nome di endpoint per visualizzare la pagina Dettagli dell'endpoint.

Testare l'endpoint usando dati di esempio

Nella pagina dell'endpoint è possibile usare la scheda Test per testare la distribuzione online gestita. Per immettere l'input di esempio e visualizzare i risultati, seguire questa procedura:

Nella pagina endpoint passare alla scheda Test . Nell'elenco Distribuzione la blue distribuzione è già selezionata.
Passare al filesample-request.json e copiarne l'input di esempio.
In studio incollare l'input di esempio nella casella Input .
Selezionare Verifica.

Ridimensionare una distribuzione esistente per gestire più traffico

Nella distribuzione descritta in Distribuire e assegnare un punteggio a un modello di Machine Learning usando un endpoint online, impostare il instance_count valore su 1 nel file YAML di distribuzione. È possibile aumentare il numero di istanze usando il update comando :

az ml online-deployment update --name blue --endpoint-name $ENDPOINT_NAME --set instance_count=2

Nota

Nel comando precedente, l'opzione --set esegue l'override della configurazione di distribuzione. In alternativa, è possibile aggiornare il file YAML e passarlo come input al update comando usando l'opzione --file .

È possibile usare l'istanza di MLClient creata in precedenza per ottenere un riferimento per l'installazione. Per ridimensionare la distribuzione, è possibile aumentare o ridurre il valore di instance_count.

# scale the deployment
blue_deployment = ml_client.online_deployments.get(
    name="blue", endpoint_name=online_endpoint_name
)
blue_deployment.instance_count = 2
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

Ottenere informazioni dettagliate sull'endpoint

# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

Per aumentare o ridurre la distribuzione modificando il numero di istanze, seguire questa procedura:

Nella pagina endpoint passare alla scheda Dettagli e trovare la scheda per la blue distribuzione.
Nell'intestazione della blue scheda di distribuzione selezionare l'icona di modifica.
In Numero di istanze immettere 2.
Selezionare Aggiorna.

Distribuire un nuovo modello ma non gestire il traffico verso di esso

Creare una nuova distribuzione denominata green:

az ml online-deployment create --name green --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/green-deployment.yml

Poiché non viene esplicitamente allocato alcun traffico alla distribuzione green, a questa non è allocato alcun traffico. È possibile verificare il fatto usando il comando seguente:

az ml online-endpoint show -n $ENDPOINT_NAME --query traffic

Testare la nuova distribuzione

Anche se alla distribuzione è allocato lo 0% del traffico, è possibile richiamarla direttamente usando l'opzione --deployment.

az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment-name green --request-file endpoints/online/model-2/sample-request.json

Per usare un client REST per richiamare la distribuzione direttamente, senza passare attraverso le regole del traffico, impostare l'intestazione HTTP seguente: azureml-model-deployment: <deployment-name>. Il codice seguente usa Client per URL (cURL) per richiamare direttamente la distribuzione. È possibile eseguire il codice in un ambiente Unix o Sottosistema Windows per Linux (WSL). Per istruzioni sul recupero del valore, vedere Ottenere la chiave o il token per le operazioni del $ENDPOINT_KEY piano dati.

# get the scoring uri
SCORING_URI=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query scoring_uri)
# use curl to invoke the endpoint
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --header "azureml-model-deployment: green" --data @endpoints/online/model-2/sample-request.json

Creare una nuova distribuzione per l'endpoint online gestito e denominare la distribuzione green:

# create green deployment
model2 = Model(path="../model-2/model/sklearn_regression_model.pkl")
env2 = Environment(
    conda_file="../model-2/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

green_deployment = ManagedOnlineDeployment(
    name="green",
    endpoint_name=online_endpoint_name,
    model=model2,
    environment=env2,
    code_configuration=CodeConfiguration(
        code="../model-2/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)

# use MLClient to create green deployment
ml_client.online_deployments.begin_create_or_update(green_deployment).result()

Nota

Se si sta creando una distribuzione per un endpoint online Kubernetes, usare la KubernetesOnlineDeployment classe e specificare un tipo di istanza Kubernetes nel cluster Kubernetes.

Testare la nuova distribuzione

Anche se la green distribuzione ha il 0% del traffico allocato, è comunque possibile richiamare l'endpoint e la distribuzione. Il codice seguente usa il file JSONsample-request.json per inviare una richiesta di esempio.

ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="green",
    request_file="../model-2/sample-request.json",
)

È possibile creare una nuova distribuzione da aggiungere all'endpoint online gestito. Per creare una distribuzione denominata green, seguire questa procedura nelle sezioni seguenti.

Configurare le impostazioni iniziali

Nella pagina endpoint passare alla scheda Dettagli e quindi selezionare Aggiungi distribuzione.
Nella pagina Seleziona un modello selezionare model-2 e quindi selezionare Seleziona.
Nella pagina Endpoint e nella pagina Modello selezionare Avanti.
Nella pagina Distribuzione seguire questa procedura:
1. In Nome distribuzione, immettere verde.
2. In Inferenza della raccolta dati attivare l'interruttore.
3. In Diagnostica di Application Insights, attivare il toggle.
4. Seleziona Avanti.
Nella pagina Codice e ambiente per l'inferenza seguire questa procedura:
1. Sotto Seleziona uno script di punteggio per l'inferenza, seleziona Sfoglia, e poi seleziona il file \azureml-examples\cli\endpoints\online\model-2\onlinescoring\score.py dal repository che hai clonato o scaricato in precedenza.
2. Nella casella di ricerca sopra l'elenco degli ambienti, inizia a digitare sklearn e quindi seleziona l'ambiente curato sklearn-1.5:19.
3. Seleziona Avanti.
Nella pagina Calcolo seguire questa procedura:
1. In Macchina virtuale mantenere il valore predefinito.
2. In Numero di istanze sostituire il valore predefinito con 1.
3. Seleziona Avanti.

Configurare le impostazioni rimanenti e creare la distribuzione

Nella pagina Traffico attivo selezionare Avanti per accettare l'allocazione del traffico predefinita del 100% alla blue distribuzione e il 0% a green.
Nella pagina Verifica esaminare le impostazioni di distribuzione e quindi selezionare Crea.

Aggiungere una distribuzione dalla pagina Modelli

In alternativa, è possibile usare la pagina Modelli per aggiungere una distribuzione:

In Studio selezionare Modelli.
Selezionare un modello nell'elenco.
Selezionare Distribuisci>Endpoint in tempo reale.
In Endpoint selezionare Esistente.
Nell'elenco degli endpoint selezionare l'endpoint online gestito in cui si vuole distribuire il modello e quindi selezionare Avanti.
Nella pagina Modello selezionare Avanti.
Per completare la creazione della green distribuzione, seguire i passaggi da 4 a 6 nella sezione Configurare le impostazioni iniziali e tutti i passaggi descritti nella sezione Configurare le impostazioni rimanenti e creare la distribuzione .

Nota

Quando si aggiunge una nuova distribuzione a un endpoint, è possibile usare la pagina Aggiorna allocazione traffico per regolare il bilanciamento del traffico tra le distribuzioni. Tuttavia, per seguire le altre procedure descritte in questo articolo, mantenere l'allocazione del traffico predefinita del 100% alla blue distribuzione per il momento e il 0% per la green distribuzione.

Testare la nuova distribuzione

Anche se lo 0% del traffico passa alla distribuzione green, è comunque possibile richiamare l'endpoint e la distribuzione. Nella pagina dell'endpoint è possibile usare la scheda Test per testare la distribuzione online gestita. Per immettere l'input di esempio e visualizzare i risultati, seguire questa procedura:

Nella pagina endpoint passare alla scheda Test .
Nell'elenco Distribuzione selezionare verde.
Passare al filesample-request.json e copiarne l'input di esempio.
In studio incollare l'input di esempio nella casella Input .
Selezionare Verifica.

Testare la distribuzione con il traffico con mirroring

Dopo aver testato la green distribuzione, è possibile eseguire il mirroring di una percentuale del traffico attivo verso l'endpoint copiando tale percentuale di traffico e inviandola alla green distribuzione. Il mirroring del traffico, detto anche shadowing, non modifica i risultati restituiti ai client—il 100% delle richieste continua a fluire verso l’blue implementazione. La percentuale di traffico specchiato viene copiata e inviata anche alla green distribuzione in modo da poter raccogliere metriche e log senza impattare i clienti.

Il mirroring è utile per convalidare una nuova distribuzione senza impatto sui client. Ad esempio, è possibile usare il mirroring per verificare se la latenza si trova all'interno di limiti accettabili o per verificare che non siano presenti errori HTTP. L'uso del mirroring del traffico, o shadowing, per testare una nuova distribuzione è noto anche come shadow testing. La distribuzione che riceve il traffico con mirroring, in questo caso, la green distribuzione, può anche essere chiamata distribuzione ombra.

Il mirroring presenta le limitazioni seguenti:

Il mirroring è supportato per le versioni 2.4.0 e successive dell'interfaccia della riga di comando di Azure Machine Learning e delle versioni 1.0.0 e successive di Python SDK. Se si usa una versione precedente dell'interfaccia della riga di comando di Azure Machine Learning o Python SDK per aggiornare un endpoint, si perde l'impostazione del traffico mirror.
Il mirroring non è attualmente supportato per gli endpoint online kubernetes.
È possibile eseguire il mirroring del traffico a una sola distribuzione in un endpoint.
La percentuale massima di traffico che è possibile eseguire il mirroring è del 50%. Questo limite limita l'effetto sulla quota di larghezza di banda dell'endpoint, che ha un valore predefinito di 5 MBps. La larghezza di banda dell'endpoint viene limitata se si supera la quota allocata. Per informazioni sul monitoraggio della limitazione della larghezza di banda, vedere Limitazione della larghezza di banda.

Si noti anche il comportamento seguente:

È possibile configurare una distribuzione per ricevere solo traffico live o traffico con mirroring, non entrambi.
Quando si richiama un endpoint, è possibile specificare il nome di una delle relative distribuzioni, anche una distribuzione shadow, per restituire la stima.
Quando si richiama un endpoint e si specifica il nome di una distribuzione per ricevere il traffico in ingresso, Azure Machine Learning non esegue il mirroring del traffico verso la distribuzione shadow. Azure Machine Learning esegue il mirroring del traffico verso la distribuzione shadow dal traffico inviato all'endpoint quando non si specifica una distribuzione.

Se si imposta la distribuzione per ricevere il green 10% del traffico con mirroring, i client ricevono comunque stime solo dalla blue distribuzione.

Diagramma che mostra il flusso del traffico attraverso un endpoint. Tutto il traffico passa alla distribuzione blu e il 10% viene eseguito il mirroring alla distribuzione verde.

Usare il comando seguente per eseguire il mirroring del 10% del traffico e inviarlo alla green distribuzione:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=10"

È possibile testare il traffico con mirroring richiamando l'endpoint più volte senza specificare una distribuzione per ricevere il traffico in ingresso:

for i in {1..20} ; do
    az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
done

È possibile confermare che la percentuale di traffico specificata venga inviata all'implementazione green controllando i log della stessa implementazione.

az ml online-deployment get-logs --name green --endpoint $ENDPOINT_NAME

Dopo il test, è possibile impostare il traffico con mirroring su zero per disabilitare il mirroring:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=0"

Usare il codice seguente per eseguire il mirroring del 10% del traffico e inviarlo alla green distribuzione:

endpoint.mirror_traffic = {"green": 10}
ml_client.begin_create_or_update(endpoint).result()

È possibile testare il traffico con mirroring richiamando l'endpoint più volte senza specificare una distribuzione per ricevere il traffico in ingresso:

# You can test mirror traffic by invoking the endpoint several times
for i in range(20):
    ml_client.online_endpoints.invoke(
        endpoint_name=online_endpoint_name,
        request_file="../model-1/sample-request.json",
    )

È possibile verificare che la percentuale specifica del traffico sia inviata alla green implementazione controllando i log dell'implementazione.

ml_client.online_deployments.get_logs(
    name="green", endpoint_name=online_endpoint_name, lines=50
)

Dopo il test, è possibile impostare il traffico con mirroring su zero per disabilitare il mirroring:

endpoint.mirror_traffic = {"green": 0}
ml_client.begin_create_or_update(endpoint).result()

Per eseguire il mirroring del 10% del traffico e inviarlo alla green distribuzione, seguire questa procedura:

Nella pagina dell'endpoint passare alla scheda Dettagli e quindi selezionare Aggiorna traffico.
Attiva il commutatore Abilita traffico con mirroring.
Nell'elenco Nome distribuzione selezionare verde.
In Allocazione del traffico %mantenere il valore predefinito del 10%.
Selezionare Aggiorna.

La pagina dei dettagli dell'endpoint mostra ora un'allocazione del traffico con mirroring del 10% alla green distribuzione.

Per testare il traffico con mirroring, vedere le schede dell'interfaccia della riga di comando di Azure o Python per richiamare l'endpoint più volte. Verificare che la percentuale di traffico specificata venga inviata alla distribuzione green controllando i log di distribuzione. È possibile accedere ai log di distribuzione nella pagina dell'endpoint passando alla scheda Log .

È anche possibile usare metriche e log per monitorare le prestazioni del traffico con mirroring. Per altre informazioni, vedere Monitorare gli endpoint online.

Dopo il test, è possibile disabilitare il mirroring seguendo questa procedura:

Nella pagina dell'endpoint passare alla scheda Dettagli e quindi selezionare Aggiorna traffico.
Disattiva l'opzione Abilita traffico con mirroring.
Selezionare Aggiorna.

Allocare una piccola percentuale di traffico live alla nuova distribuzione

Dopo aver testato la distribuzione green, allocate una piccola percentuale di traffico ad essa.

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=90 green=10"

endpoint.traffic = {"blue": 90, "green": 10}
ml_client.begin_create_or_update(endpoint).result()

Suggerimento

La percentuale di traffico totale deve essere pari al 0% per disabilitare il traffico o il 100% per abilitare il traffico.

Ora la distribuzione green riceve il 10% del traffico totale live. I clienti ricevono previsioni sia dalle implementazioni blue che green.

Diagramma che mostra il flusso del traffico attraverso un endpoint. La distribuzione blu riceve il 90% del traffico e la distribuzione verde, il 10%.

Inviare tutto il traffico alla nuova distribuzione

Quando si è completamente soddisfatti della green distribuzione, reindirizzare tutto il traffico verso di essa.

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=0 green=100"

endpoint.traffic = {"blue": 0, "green": 100}
ml_client.begin_create_or_update(endpoint).result()

Rimuovere la distribuzione precedente

Seguire questa procedura per eliminare una singola distribuzione da un endpoint online gestito. L'eliminazione di una singola distribuzione non influisce sulle altre distribuzioni nell'endpoint online gestito:

az ml online-deployment delete --name blue --endpoint $ENDPOINT_NAME --yes --no-wait

ml_client.online_deployments.begin_delete(
    name="blue", endpoint_name=online_endpoint_name
).wait()

Eliminare l'endpoint e la distribuzione

Se non si intende usare l'endpoint e la distribuzione, è necessario eliminarli. Quando si elimina un endpoint, vengono eliminate anche tutte le distribuzioni sottostanti.

az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

Condividi tramite

Eseguire l'implementazione sicura delle nuove distribuzioni per l'inferenza in tempo reale

Prerequisiti

Preparare il sistema

Impostare le variabili di ambiente

Clonare il repository di esempi

Definire l'endpoint e la distribuzione

Definire un endpoint

Definire una distribuzione

Creare un endpoint online

Creare l'implementazione blu

Confermare la distribuzione esistente

Richiamare un endpoint con un nome di distribuzione

Richiamare l'endpoint senza specificare una distribuzione

Testare l'endpoint usando dati di esempio

Ridimensionare una distribuzione esistente per gestire più traffico

Distribuire un nuovo modello ma non gestire il traffico verso di esso

Testare la nuova distribuzione

Testare la distribuzione con il traffico con mirroring

Allocare una piccola percentuale di traffico live alla nuova distribuzione

Inviare tutto il traffico alla nuova distribuzione

Rimuovere la distribuzione precedente

Eliminare l'endpoint e la distribuzione

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive