Condividi tramite


Schema YAML dell'endpoint online dell'interfaccia della riga di comando (v2)

SI APPLICA A: estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)

Lo schema JSON di origine è disponibile in https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json per l'endpoint online gestito e in https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json per l'endpoint online Kubernetes. Le differenze tra l'endpoint online gestito e l'endpoint online Kubernetes sono descritte nella tabella delle proprietà in questo articolo. L'esempio in questo articolo è incentrato sull'endpoint online gestito.

Nota

La sintassi YAML descritta in dettaglio in questo documento si basa sullo schema JSON per la versione più recente dell'estensione dell'interfaccia della riga di comando di Machine Learning v2. Il funzionamento di questa sintassi è garantito solo con la versione più recente dell'estensione dell'interfaccia della riga di comando di Machine Learning v2. È possibile trovare gli schemi per le versioni di estensione precedenti in https://azuremlschemasprod.azureedge.net/.

Nota

Un esempio YAML completo per gli endpoint online gestiti è disponibile come riferimento

Sintassi YAML

Chiave Type Descrizione Valori consentiti Valore predefinito
$schema string Schema YAML. Se si usa l'estensione Azure Machine Learning per Visual Studio Code per creare il file YAML, l'inclusione di $schema nella parte superiore del file consente di richiamare i completamenti dello schema e delle risorse.
name string Obbligatorio. Nome dell'endpoint. Deve essere univoca a livello di area di Azure.

Le regole di denominazione vengono definite in Limiti degli endpoint.
description string Descrizione dell'endpoint.
tags oggetto Dizionario dei tag per l'endpoint.
auth_mode string Metodo di autenticazione per richiamare l'endpoint (operazione del piano dati). Usare key per l'autenticazione basata su chiave. Usare aml_token per l'autenticazione basata su token di Azure Machine Learning. Usare aad_token per l'autenticazione basata su token di Microsoft Entra. key, aml_token, aad_token key
compute string Nome della destinazione di calcolo in cui eseguire le distribuzioni dell'endpoint. Questo campo è applicabile solo per le distribuzioni di endpoint nei cluster Kubernetes abilitati per Azure Arc. La destinazione di calcolo specificata in questo campo deve avere type: kubernetes. Non specificare questo campo se si esegue l'inferenza online gestita.
identity oggetto Configurazione dell'identità gestita per l'accesso alle risorse di Azure per il provisioning e l'inferenza degli endpoint.
identity.type string Tipo di identità gestita. Se il tipo è user_assigned, è necessario specificare anche la proprietà identity.user_assigned_identities. system_assigned, user_assigned
identity.user_assigned_identities array Elenco degli ID risorsa completi delle identità assegnate dall'utente.
traffic oggetto Il traffico rappresenta la percentuale di richieste da gestire da distribuzioni diverse. È rappresentato da un dizionario di coppie chiave-valore, in cui le chiavi rappresentano il nome della distribuzione e i valori rappresentano la percentuale di traffico verso tale distribuzione. Ad esempio, blue: 90 green: 10 indica che il 90% delle richieste viene inviato alla distribuzione denominata blue e il 10% viene inviato alla distribuzione green. Il traffico totale deve essere 0 o la somma dei rispettivi valori deve essere pari al massimo a 100. Per visualizzare la configurazione del traffico in azione, vedere Implementazione sicura per gli endpoint online.

Nota: non è possibile impostare questo campo durante la creazione dell'endpoint online, perché le distribuzioni in tale endpoint devono essere create prima che sia possibile impostare il traffico. È possibile aggiornare il traffico per un endpoint online dopo aver creato le distribuzioni usando az ml online-endpoint update. Ad esempio, az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10".
public_network_access string Questo flag controlla la visibilità dell'endpoint gestito. Quando è disabled, le richieste di assegnazione dei punteggi in ingresso vengono ricevute usando l'endpoint privato dell'area di lavoro di Azure Machine Learning e l'endpoint non può essere raggiunto dalle reti pubbliche. Questo flag è applicabile solo per gli endpoint gestiti enabled, disabled enabled
mirror_traffic string Percentuale di traffico attivo di cui eseguire il mirroring in una distribuzione. Il traffico con mirroring non modifica i risultati restituiti ai client. La percentuale di traffico con mirroring viene copiata e inviata alla distribuzione specificata in modo da poter raccogliere metriche e le registrazioni senza influire sui client, ad esempio per verificare se la latenza rientra in limiti accettabili e assicurarsi che non siano presenti errori HTTP. È rappresentato da un dizionario con una singola coppia chiave-valore, in cui la chiave rappresenta il nome della distribuzione e il valore rappresenta la percentuale di traffico di cui eseguire il mirroring nella distribuzione. Per altre informazioni, vedere Testare una distribuzione con traffico con mirroring.

Osservazioni:

I comandi az ml online-endpoint possono essere usati per la gestione degli endpoint online di Azure Machine Learning.

Esempi

Gli esempi sono disponibili nel repository GitHub di esempi. Di seguito sono riportati alcuni esempi.

YAML: di base

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: identità assegnata dal sistema

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: identità assegnata dall'utente

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Passaggi successivi