Schéma YAML online koncového bodu CLI (v2)
PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)
Zdrojové schéma JSON najdete pro https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json spravovaný online koncový bod a pro https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json online koncový bod Kubernetes. Rozdíly mezi spravovaným online koncovým bodem a online koncovým bodem Kubernetes jsou popsané v tabulce vlastností v tomto článku. Ukázka v tomto článku se zaměřuje na spravovaný online koncový bod.
Poznámka:
Syntaxe YAML podrobná v tomto dokumentu je založená na schématu JSON pro nejnovější verzi rozšíření ML CLI v2. Tato syntaxe je zaručena pouze pro práci s nejnovější verzí rozšíření ML CLI v2. Schémata pro starší verze rozšíření najdete na adrese https://azuremlschemasprod.azureedge.net/.
Poznámka:
Plně zadaný ukázkový YAML pro spravované online koncové body je k dispozici pro referenci.
Syntaxe YAML
Klíč | Typ | Popis | Povolené hodnoty | Default value |
---|---|---|---|---|
$schema |
string | Schéma YAML. Pokud k vytvoření souboru YAML použijete rozšíření Azure Machine Learning VS Code, včetně $schema v horní části souboru, můžete vyvolat schéma a dokončování prostředků. |
||
name |
string | Povinný: Název koncového bodu Musí být jedinečný na úrovni oblasti Azure. Pravidla pojmenování jsou definována v rámci limitů koncových bodů. |
||
description |
string | Popis koncového bodu | ||
tags |
objekt | Slovník značek pro koncový bod | ||
auth_mode |
string | Metoda ověřování pro vyvolání koncového bodu (operace roviny dat). Používá se key pro ověřování založené na klíčích. Používá se aml_token pro ověřování na základě tokenů služby Azure Machine Learning. Používá se aad_token pro ověřování založené na tokenech Microsoft Entra. |
key , , aml_token aad_token |
key |
compute |
string | Název cílového výpočetního objektu pro spuštění nasazení koncových bodů Toto pole platí jenom pro nasazení koncových bodů do clusterů Kubernetes s podporou Služby Azure Arc (cílový výpočetní objekt zadaný v tomto poli musí obsahovat type: kubernetes ). Toto pole nezadávejte, pokud provádíte online odvozování. |
||
identity |
objekt | Konfigurace spravované identity pro přístup k prostředkům Azure pro zřizování koncových bodů a odvozování. | ||
identity.type |
string | Typ spravované identity. Pokud je user_assigned typ, identity.user_assigned_identities musí být zadána také vlastnost. |
system_assigned , user_assigned |
|
identity.user_assigned_identities |
pole | Seznam plně kvalifikovaných ID prostředků identit přiřazených uživatelem | ||
traffic |
objekt | Provoz představuje procento požadavků, které mají být obsluhovány různými nasazeními. Reprezentuje ho slovník párů klíč-hodnota, kde klíče představují název nasazení a hodnotu představují procento provozu do tohoto nasazení. Například znamená, blue: 90 green: 10 že do nasazení blue se odešle 90 % požadavků a do nasazení green se odešle 10 %. Celkový provoz musí být buď 0, nebo součet až 100. Informace o konfiguraci provozu v akci najdete v části Bezpečné zavedení pro online koncové body . Poznámka: Toto pole nemůžete nastavit při vytváření online koncového bodu, protože nasazení v tomto koncovém bodu musí být vytvořena, než bude možné nastavit provoz. Po vytvoření nasazení můžete aktualizovat provoz pro online koncový bod, az ml online-endpoint update například az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10" . |
||
public_network_access |
string | Tento příznak řídí viditelnost spravovaného koncového bodu. Když disabled se příchozí žádosti o bodování přijímají pomocí privátního koncového bodu pracovního prostoru Azure Machine Learning a koncový bod není dostupný z veřejných sítí. Tento příznak platí jenom pro spravované koncové body. |
enabled , disabled |
enabled |
mirror_traffic |
string | Procento živého provozu, které se má zrcadlit do nasazení Zrcadlení provozu nemění výsledky vrácené klientům. Zrcadlené procento provozu se zkopíruje a odešle do zadaného nasazení, abyste mohli shromažďovat metriky a protokolování bez dopadu na klienty. Pokud chcete například zkontrolovat, jestli je latence v přijatelných mezích a jestli nedošlo k žádným chybám HTTP. Představuje ho slovník s jednou dvojicí klíč-hodnota, kde klíč představuje název nasazení a hodnota představuje procento provozu, které se má zrcadlit do nasazení. Další informace najdete v tématu Testování nasazení se zrcadleným provozem. |
Poznámky
Příkazy az ml online-endpoint
se dají použít ke správě online koncových bodů služby Azure Machine Learning.
Příklady
Příklady jsou k dispozici v příkladech v úložišti GitHub. Níže je uvedeno několik.
YAML: základní
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key
YAML: identita přiřazená systémem
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key
YAML: identita přiřazená uživatelem
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
type: user_assigned
user_assigned_identities:
- resource_id: user_identity_ARM_id_place_holder