Udostępnij za pośrednictwem


Schemat YAML punktu końcowego online (wersja 2) interfejsu wiersza polecenia

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure ml w wersji 2 (bieżąca)

Źródłowy schemat JSON można znaleźć w witrynie https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json dotyczącej zarządzanego punktu końcowego online i punktu https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json końcowego online platformy Kubernetes. Różnice między zarządzanym punktem końcowym online i punktem końcowym online platformy Kubernetes zostały opisane w tabeli właściwości w tym artykule. Przykład w tym artykule koncentruje się na zarządzanym punkcie końcowym online.

Uwaga

Składnia YAML szczegółowo w tym dokumencie jest oparta na schemacie JSON dla najnowszej wersji rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Ta składnia jest gwarantowana tylko do pracy z najnowszą wersją rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Schematy dla starszych wersji rozszerzeń można znaleźć pod adresem https://azuremlschemasprod.azureedge.net/.

Uwaga

W pełni określony przykład YAML dla zarządzanych punktów końcowych online jest dostępny do celów referencyjnych

Składnia YAML

Klucz Type Opis Dozwolone wartości Domyślna wartość
$schema string Schemat YAML. Jeśli używasz rozszerzenia programu VS Code usługi Azure Machine Learning do tworzenia pliku YAML, w tym $schema w górnej części pliku, możesz wywołać uzupełnianie schematu i zasobów.
name string Wymagany. Nazwa punktu końcowego. Musi być unikatowa na poziomie regionu świadczenia usługi Azure.

Reguły nazewnictwa są definiowane w ramach limitów punktów końcowych.
description string Opis punktu końcowego.
tags obiekt Słownik tagów dla punktu końcowego.
auth_mode string Metoda uwierzytelniania wywoływania punktu końcowego (operacja płaszczyzny danych). Służy key do uwierzytelniania opartego na kluczach. Służy aml_token do uwierzytelniania opartego na tokenach usługi Azure Machine Learning. Służy aad_token do uwierzytelniania opartego na tokenach firmy Microsoft. key, , aml_tokenaad_token key
compute string Nazwa docelowego obiektu obliczeniowego do uruchamiania wdrożeń punktu końcowego. To pole ma zastosowanie tylko w przypadku wdrożeń punktów końcowych w klastrach Kubernetes z włączoną usługą Azure Arc (docelowy obiekt obliczeniowy określony w tym polu musi mieć wartość type: kubernetes). Nie określaj tego pola, jeśli wykonujesz zarządzane wnioskowanie online.
identity obiekt Konfiguracja tożsamości zarządzanej na potrzeby uzyskiwania dostępu do zasobów platformy Azure na potrzeby aprowizacji i wnioskowania punktu końcowego.
identity.type string Typ tożsamości zarządzanej. Jeśli typ to user_assigned, identity.user_assigned_identities należy również określić właściwość . system_assigned, user_assigned
identity.user_assigned_identities tablica Lista w pełni kwalifikowanych identyfikatorów zasobów tożsamości przypisanych przez użytkownika.
traffic obiekt Ruch reprezentuje procent żądań, które mają być obsługiwane przez różne wdrożenia. Jest reprezentowana przez słownik par klucz-wartość, gdzie klucze reprezentują nazwę wdrożenia i wartość reprezentują procent ruchu do tego wdrożenia. Na przykład oznacza, blue: 90 green: 10 że 90% żądań jest wysyłanych do wdrożenia o nazwie blue , a 10% jest wysyłanych do wdrożenia green. Całkowity ruch musi wynosić 0 lub sumować do 100. Zobacz Bezpieczne wdrażanie punktów końcowych online, aby zobaczyć konfigurację ruchu w działaniu.

Uwaga: nie można ustawić tego pola podczas tworzenia punktu końcowego online, ponieważ przed ustawieniem ruchu należy utworzyć wdrożenia w ramach tego punktu końcowego. Ruch dla punktu końcowego online można zaktualizować po utworzeniu wdrożeń przy użyciu az ml online-endpoint updatepolecenia , na przykład az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10".
public_network_access string Ta flaga steruje widocznością zarządzanego punktu końcowego. Gdy disabledżądania oceny ruchu przychodzącego są odbierane przy użyciu prywatnego punktu końcowego obszaru roboczego usługi Azure Machine Learning i nie można uzyskać dostępu do punktu końcowego z sieci publicznych. Ta flaga ma zastosowanie tylko dla zarządzanych punktów końcowych enabled, disabled enabled
mirror_traffic string Procent ruchu na żywo do dublowania do wdrożenia. Ruch dublujący nie zmienia wyników zwracanych do klientów. Dublowany procent ruchu jest kopiowany i przesyłany do określonego wdrożenia, dzięki czemu można zbierać metryki i rejestrowanie bez wpływu na klientów. Aby na przykład sprawdzić, czy opóźnienie mieści się w dopuszczalnych granicach i czy nie ma błędów HTTP. Jest reprezentowana przez słownik z pojedynczą parą klucz-wartość, gdzie klucz reprezentuje nazwę wdrożenia, a wartość reprezentuje procent ruchu do dublowania do wdrożenia. Aby uzyskać więcej informacji, zobacz Testowanie wdrożenia przy użyciu dublowanego ruchu.

Uwagi

Polecenia az ml online-endpoint mogą służyć do zarządzania punktami końcowymi online usługi Azure Machine Learning.

Przykłady

Przykłady są dostępne w repozytorium GitHub przykłady. Poniżej przedstawiono kilka z poniższych elementów.

YAML: podstawowy

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: tożsamość przypisana przez system

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: tożsamość przypisana przez użytkownika

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Następne kroki