Schemat YAML punktu końcowego online (wersja 2) interfejsu wiersza polecenia

Artykuł
09/02/2024

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure ml w wersji 2 (bieżąca)

Źródłowy schemat JSON można znaleźć w witrynie https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json dotyczącej zarządzanego punktu końcowego online i punktu https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json końcowego online platformy Kubernetes. Różnice między zarządzanym punktem końcowym online i punktem końcowym online platformy Kubernetes zostały opisane w tabeli właściwości w tym artykule. Przykład w tym artykule koncentruje się na zarządzanym punkcie końcowym online.

Uwaga

Składnia YAML szczegółowo w tym dokumencie jest oparta na schemacie JSON dla najnowszej wersji rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Ta składnia jest gwarantowana tylko do pracy z najnowszą wersją rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Schematy dla starszych wersji rozszerzeń można znaleźć pod adresem https://azuremlschemasprod.azureedge.net/.

Uwaga

W pełni określony przykład YAML dla zarządzanych punktów końcowych online jest dostępny do celów referencyjnych

Składnia YAML

Klucz	Type	Opis	Dozwolone wartości	Domyślna wartość
`$schema`	string	Schemat YAML. Jeśli używasz rozszerzenia programu VS Code usługi Azure Machine Learning do tworzenia pliku YAML, w tym `$schema` w górnej części pliku, możesz wywołać uzupełnianie schematu i zasobów.
`name`	string	Wymagany. Nazwa punktu końcowego. Musi być unikatowa na poziomie regionu świadczenia usługi Azure. Reguły nazewnictwa są definiowane w ramach limitów punktów końcowych.
`description`	string	Opis punktu końcowego.
`tags`	obiekt	Słownik tagów dla punktu końcowego.
`auth_mode`	string	Metoda uwierzytelniania wywoływania punktu końcowego (operacja płaszczyzny danych). Służy `key` do uwierzytelniania opartego na kluczach. Służy `aml_token` do uwierzytelniania opartego na tokenach usługi Azure Machine Learning. Służy `aad_token` do uwierzytelniania opartego na tokenach firmy Microsoft.	`key`, , `aml_tokenaad_token`	`key`
`compute`	string	Nazwa docelowego obiektu obliczeniowego do uruchamiania wdrożeń punktu końcowego. To pole ma zastosowanie tylko w przypadku wdrożeń punktów końcowych w klastrach Kubernetes z włączoną usługą Azure Arc (docelowy obiekt obliczeniowy określony w tym polu musi mieć wartość `type: kubernetes`). Nie określaj tego pola, jeśli wykonujesz zarządzane wnioskowanie online.
`identity`	obiekt	Konfiguracja tożsamości zarządzanej na potrzeby uzyskiwania dostępu do zasobów platformy Azure na potrzeby aprowizacji i wnioskowania punktu końcowego.
`identity.type`	string	Typ tożsamości zarządzanej. Jeśli typ to `user_assigned`, `identity.user_assigned_identities` należy również określić właściwość .	`system_assigned`, `user_assigned`
`identity.user_assigned_identities`	tablica	Lista w pełni kwalifikowanych identyfikatorów zasobów tożsamości przypisanych przez użytkownika.
`traffic`	obiekt	Ruch reprezentuje procent żądań, które mają być obsługiwane przez różne wdrożenia. Jest reprezentowana przez słownik par klucz-wartość, gdzie klucze reprezentują nazwę wdrożenia i wartość reprezentują procent ruchu do tego wdrożenia. Na przykład oznacza, `blue: 90 green: 10` że 90% żądań jest wysyłanych do wdrożenia o nazwie `blue` , a 10% jest wysyłanych do wdrożenia `green`. Całkowity ruch musi wynosić 0 lub sumować do 100. Zobacz Bezpieczne wdrażanie punktów końcowych online, aby zobaczyć konfigurację ruchu w działaniu. Uwaga: nie można ustawić tego pola podczas tworzenia punktu końcowego online, ponieważ przed ustawieniem ruchu należy utworzyć wdrożenia w ramach tego punktu końcowego. Ruch dla punktu końcowego online można zaktualizować po utworzeniu wdrożeń przy użyciu `az ml online-endpoint update`polecenia , na przykład `az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10"`.
`public_network_access`	string	Ta flaga steruje widocznością zarządzanego punktu końcowego. Gdy `disabled`żądania oceny ruchu przychodzącego są odbierane przy użyciu prywatnego punktu końcowego obszaru roboczego usługi Azure Machine Learning i nie można uzyskać dostępu do punktu końcowego z sieci publicznych. Ta flaga ma zastosowanie tylko dla zarządzanych punktów końcowych	`enabled`, `disabled`	`enabled`
`mirror_traffic`	string	Procent ruchu na żywo do dublowania do wdrożenia. Ruch dublujący nie zmienia wyników zwracanych do klientów. Dublowany procent ruchu jest kopiowany i przesyłany do określonego wdrożenia, dzięki czemu można zbierać metryki i rejestrowanie bez wpływu na klientów. Aby na przykład sprawdzić, czy opóźnienie mieści się w dopuszczalnych granicach i czy nie ma błędów HTTP. Jest reprezentowana przez słownik z pojedynczą parą klucz-wartość, gdzie klucz reprezentuje nazwę wdrożenia, a wartość reprezentuje procent ruchu do dublowania do wdrożenia. Aby uzyskać więcej informacji, zobacz Testowanie wdrożenia przy użyciu dublowanego ruchu.

Uwagi

Polecenia az ml online-endpoint mogą służyć do zarządzania punktami końcowymi online usługi Azure Machine Learning.

Przykłady

Przykłady są dostępne w repozytorium GitHub przykłady. Poniżej przedstawiono kilka z poniższych elementów.

YAML: podstawowy

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: tożsamość przypisana przez system

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: tożsamość przypisana przez użytkownika

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Udostępnij za pośrednictwem