CLI (v2) esquema YAML de ponto de extremidade online

Artigo
04/30/2024

APLICA-SE A: Azure CLI ml extension v2 (atual)

O esquema JSON de origem pode ser encontrado em https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json para endpoint online gerenciado e em https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json para endpoint online do Kubernetes. As diferenças entre o endpoint online gerenciado e o endpoint online do Kubernetes são descritas na tabela de propriedades deste artigo. O exemplo neste artigo se concentra no endpoint online gerenciado.

Nota

A sintaxe YAML detalhada neste documento é baseada no esquema JSON para a versão mais recente da extensão ML CLI v2. Esta sintaxe é garantida apenas para funcionar com a versão mais recente da extensão ML CLI v2. Você pode encontrar os esquemas para versões de extensão mais antigas em https://azuremlschemasprod.azureedge.net/.

Nota

Um exemplo de YAML totalmente especificado para pontos de extremidade on-line gerenciados está disponível para referência

Sintaxe YAML

Chave	Tipo	Description	Valores permitidos	Default value
`$schema`	string	O esquema YAML. Se você usar a extensão VS Code do Aprendizado de Máquina do Azure para criar o arquivo YAML, inclusive `$schema` na parte superior do arquivo permitirá que você invoque o esquema e as completações de recursos.
`name`	string	Obrigatório. Nome do ponto de extremidade. Precisa ser exclusivo no nível da região do Azure. As regras de nomenclatura são definidas em limites de ponto final.
`description`	string	Descrição do parâmetro de avaliação.
`tags`	objeto	Dicionário de tags para o ponto de extremidade.
`auth_mode`	string	O método de autenticação para invocar o ponto de extremidade (operação do plano de dados). Use `key` para autenticação baseada em chave. Use `aml_token` para autenticação baseada em token do Azure Machine Learning. Use `aad_token` para autenticação baseada em token do Microsoft Entra (visualização).	`key`, `aml_token`, `aad_token`	`key`
`compute`	string	Nome do destino de computação no qual executar as implantações de ponto de extremidade. Este campo só é aplicável para implantações de ponto de extremidade em clusters Kubernetes habilitados para Azure Arc (o destino de computação especificado neste campo deve ter `type: kubernetes`). Não especifique este campo se estiver fazendo inferência online gerenciada.
`identity`	objeto	A configuração de identidade gerenciada para acessar recursos do Azure para provisionamento e inferência de ponto de extremidade.
`identity.type`	string	O tipo de identidade gerenciada. Se o tipo for `user_assigned`, a `identity.user_assigned_identities` propriedade também deve ser especificada.	`system_assigned`, `user_assigned`
`identity.user_assigned_identities`	matriz	Lista de IDs de recursos totalmente qualificados das identidades atribuídas pelo usuário.
`traffic`	objeto	O tráfego representa a porcentagem de solicitações a serem atendidas por diferentes implantações. Ele é representado por um dicionário de pares chave-valor, onde as chaves representam o nome da implantação e o valor representa a porcentagem de tráfego para essa implantação. Por exemplo, `blue: 90 green: 10` significa que 90% das solicitações são enviadas para a implantação nomeada `blue` e 10% são enviadas para a implantação `green`. O tráfego total tem de ser 0 ou somar até 100. Consulte Distribuição segura para pontos de extremidade online para ver a configuração de tráfego em ação. Observação: não é possível definir esse campo durante a criação do ponto de extremidade online, pois as implantações sob esse ponto de extremidade devem ser criadas antes que o tráfego possa ser definido. Você pode atualizar o tráfego de um ponto de extremidade online depois que as implantações tiverem sido criadas usando, por `az ml online-endpoint update`exemplo, `az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10"`.
`public_network_access`	string	Esse sinalizador controla a visibilidade do ponto de extremidade gerenciado. Quando `disabled`, as solicitações de pontuação de entrada são recebidas usando o ponto de extremidade privado do espaço de trabalho do Azure Machine Learning e o ponto de extremidade não pode ser acessado de redes públicas. Esse sinalizador é aplicável somente para pontos de extremidade gerenciados	`enabled`, `disabled`	`enabled`
`mirror_traffic`	string	Porcentagem de tráfego ao vivo para espelhar em uma implantação. O espelhamento do tráfego não altera os resultados retornados aos clientes. A porcentagem espelhada de tráfego é copiada e enviada para a implantação especificada para que você possa coletar métricas e registro em log sem afetar os clientes. Por exemplo, para verificar se a latência está dentro dos limites aceitáveis e se não há erros HTTP. Ele é representado por um dicionário com um único par chave-valor, onde a chave representa o nome da implantação e o valor representa a porcentagem de tráfego a ser espelhada para a implantação. Para obter mais informações, consulte Testar uma implantação com tráfego espelhado.

Observações

Os az ml online-endpoint comandos podem ser usados para gerenciar pontos de extremidade online do Azure Machine Learning.

Exemplos

Exemplos estão disponíveis no repositório GitHub de exemplos. Vários são mostrados abaixo.

YAML: básico

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: identidade atribuída pelo sistema

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: identidade atribuída pelo usuário

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Partilhar via