Schemat YAML punktu końcowego online (wersja 2) interfejsu wiersza polecenia
DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure ml w wersji 2 (bieżąca)
Źródłowy schemat JSON można znaleźć w witrynie https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json dotyczącej zarządzanego punktu końcowego online i punktu https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json końcowego online platformy Kubernetes. Różnice między zarządzanym punktem końcowym online i punktem końcowym online platformy Kubernetes zostały opisane w tabeli właściwości w tym artykule. Przykład w tym artykule koncentruje się na zarządzanym punkcie końcowym online.
Uwaga
Składnia YAML szczegółowo w tym dokumencie jest oparta na schemacie JSON dla najnowszej wersji rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Ta składnia jest gwarantowana tylko do pracy z najnowszą wersją rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Schematy dla starszych wersji rozszerzeń można znaleźć pod adresem https://azuremlschemasprod.azureedge.net/.
Uwaga
W pełni określony przykład YAML dla zarządzanych punktów końcowych online jest dostępny do celów referencyjnych
Składnia YAML
Klucz | Type | Opis | Dozwolone wartości | Domyślna wartość |
---|---|---|---|---|
$schema |
string | Schemat YAML. Jeśli używasz rozszerzenia programu VS Code usługi Azure Machine Learning do tworzenia pliku YAML, w tym $schema w górnej części pliku, możesz wywołać uzupełnianie schematu i zasobów. |
||
name |
string | Wymagany. Nazwa punktu końcowego. Musi być unikatowa na poziomie regionu świadczenia usługi Azure. Reguły nazewnictwa są definiowane w ramach limitów punktów końcowych. |
||
description |
string | Opis punktu końcowego. | ||
tags |
obiekt | Słownik tagów dla punktu końcowego. | ||
auth_mode |
string | Metoda uwierzytelniania wywoływania punktu końcowego (operacja płaszczyzny danych). Służy key do uwierzytelniania opartego na kluczach. Służy aml_token do uwierzytelniania opartego na tokenach usługi Azure Machine Learning. Służy aad_token do uwierzytelniania opartego na tokenach firmy Microsoft. |
key , , aml_token aad_token |
key |
compute |
string | Nazwa docelowego obiektu obliczeniowego do uruchamiania wdrożeń punktu końcowego. To pole ma zastosowanie tylko w przypadku wdrożeń punktów końcowych w klastrach Kubernetes z włączoną usługą Azure Arc (docelowy obiekt obliczeniowy określony w tym polu musi mieć wartość type: kubernetes ). Nie określaj tego pola, jeśli wykonujesz zarządzane wnioskowanie online. |
||
identity |
obiekt | Konfiguracja tożsamości zarządzanej na potrzeby uzyskiwania dostępu do zasobów platformy Azure na potrzeby aprowizacji i wnioskowania punktu końcowego. | ||
identity.type |
string | Typ tożsamości zarządzanej. Jeśli typ to user_assigned , identity.user_assigned_identities należy również określić właściwość . |
system_assigned , user_assigned |
|
identity.user_assigned_identities |
tablica | Lista w pełni kwalifikowanych identyfikatorów zasobów tożsamości przypisanych przez użytkownika. | ||
traffic |
obiekt | Ruch reprezentuje procent żądań, które mają być obsługiwane przez różne wdrożenia. Jest reprezentowana przez słownik par klucz-wartość, gdzie klucze reprezentują nazwę wdrożenia i wartość reprezentują procent ruchu do tego wdrożenia. Na przykład oznacza, blue: 90 green: 10 że 90% żądań jest wysyłanych do wdrożenia o nazwie blue , a 10% jest wysyłanych do wdrożenia green . Całkowity ruch musi wynosić 0 lub sumować do 100. Zobacz Bezpieczne wdrażanie punktów końcowych online, aby zobaczyć konfigurację ruchu w działaniu. Uwaga: nie można ustawić tego pola podczas tworzenia punktu końcowego online, ponieważ przed ustawieniem ruchu należy utworzyć wdrożenia w ramach tego punktu końcowego. Ruch dla punktu końcowego online można zaktualizować po utworzeniu wdrożeń przy użyciu az ml online-endpoint update polecenia , na przykład az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10" . |
||
public_network_access |
string | Ta flaga steruje widocznością zarządzanego punktu końcowego. Gdy disabled żądania oceny ruchu przychodzącego są odbierane przy użyciu prywatnego punktu końcowego obszaru roboczego usługi Azure Machine Learning i nie można uzyskać dostępu do punktu końcowego z sieci publicznych. Ta flaga ma zastosowanie tylko dla zarządzanych punktów końcowych |
enabled , disabled |
enabled |
mirror_traffic |
string | Procent ruchu na żywo do dublowania do wdrożenia. Ruch dublujący nie zmienia wyników zwracanych do klientów. Dublowany procent ruchu jest kopiowany i przesyłany do określonego wdrożenia, dzięki czemu można zbierać metryki i rejestrowanie bez wpływu na klientów. Aby na przykład sprawdzić, czy opóźnienie mieści się w dopuszczalnych granicach i czy nie ma błędów HTTP. Jest reprezentowana przez słownik z pojedynczą parą klucz-wartość, gdzie klucz reprezentuje nazwę wdrożenia, a wartość reprezentuje procent ruchu do dublowania do wdrożenia. Aby uzyskać więcej informacji, zobacz Testowanie wdrożenia przy użyciu dublowanego ruchu. |
Uwagi
Polecenia az ml online-endpoint
mogą służyć do zarządzania punktami końcowymi online usługi Azure Machine Learning.
Przykłady
Przykłady są dostępne w repozytorium GitHub przykłady. Poniżej przedstawiono kilka z poniższych elementów.
YAML: podstawowy
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key
YAML: tożsamość przypisana przez system
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key
YAML: tożsamość przypisana przez użytkownika
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
type: user_assigned
user_assigned_identities:
- resource_id: user_identity_ARM_id_place_holder