Característica de autoescala dos Serviços Cognitivos

Este artigo fornece orientações para como os clientes podem aceder a limites de taxa mais elevados nos seus recursos de Serviço Cognitivo.

Descrição Geral

Cada recurso de Serviços Cognitivos tem uma taxa de chamada estática pré-configurada (transações por segundo) que limita o número de chamadas simultâneas que os clientes podem fazer ao serviço de backend num determinado período de tempo. A funcionalidade de autoescalação aumentará/diminuirá automaticamente os limites de tarifas de recursos de um cliente com base em métricas de utilização de recursos em tempo real e métricas de capacidade de serviço de backend.

Começar com a funcionalidade de autoescala

Esta funcionalidade é desativada por padrão para cada novo recurso. Siga estas instruções para o ativar.

Vá à página do seu recurso no portal do Azure e selecione o separador Visão Geral no painel esquerdo. Na secção Essentials , encontre a linha Autoscale e selecione o link para ver o painel de Definições de Autoescalação e ativar a funcionalidade.

A imagem do portal do Azure com o painel de autoescala à direita.

Perguntas mais frequentes

Permitir a funcionalidade de autoescala significa que o meu recurso nunca mais será estrangulado?

Não, ainda podes ter 429 erros no excesso de limite de taxa. Se a sua aplicação desencadear um pico e o seu recurso reportar uma 429 resposta, a autoescala verificará a secção de projeção de capacidade disponível para ver se a capacidade atual pode acomodar um aumento de limite de taxa e responder dentro de cinco minutos.

Se a capacidade disponível for suficiente para um aumento, a autoescala aumentará gradualmente o limite de taxa do seu recurso. Se continuar a ligar para o seu recurso a uma taxa elevada que resulta em maior 429 aceleração, a sua taxa de TPS continuará a aumentar ao longo do tempo. Se isto continuar por uma hora ou mais, deverá atingir a taxa máxima (até 1000 TPS) atualmente disponível para esse recurso.

Se a capacidade disponível não for suficiente para um aumento, a função de autoescala esperará cinco minutos e verificará novamente.

E se eu precisar de um limite de taxa de incumprimento mais elevado?

Por padrão, os recursos do Serviço Cognitivo têm um limite de taxa padrão de 10 TPS. Se necessitar de um TPS predefinido mais elevado, envie um bilhete seguindo o link Novo Pedido de Apoio na página do seu recurso na portal do Azure. Lembre-se de incluir uma justificação de negócio no pedido.

Este recurso vai aumentar o meu gasto do Azure?

Os preços dos Serviços Cognitivos não mudaram e podem ser acedidos aqui. Só cobraremos as chamadas bem sucedidas feitas para APIs Serviços Cognitivos. No entanto, o aumento dos limites da taxa de chamada significa que mais transações serão concluídas, e poderá receber uma fatura mais alta.

Esteja atento a potenciais erros e às suas consequências. Se um bug na sua aplicação de cliente fizer com que ligue para o serviço centenas de vezes por segundo, isso provavelmente levaria a uma fatura muito mais alta, enquanto o custo seria muito mais limitado a um limite de taxa fixa. Erros deste tipo são da sua responsabilidade, por isso recomendamos vivamente que realize testes de desenvolvimento e atualização do cliente contra um recurso com um limite de taxa fixa antes de utilizar a funcionalidade de autoescalação.

Posso desativar esta funcionalidade se preferir limitar a taxa do que ter gastos imprevisíveis?

Sim, pode desativar a funcionalidade de autoescalação através de portal do Azure ou CLI e voltar à definição de limite de taxa de chamada predefinido. Se o seu recurso tiver sido previamente aprovado para um TPS padrão mais elevado, voltará a essa taxa. Pode levar até cinco minutos para que as alterações entrem em vigor.

Que serviços suportam a funcionalidade de autoescala?

A funcionalidade de autoescala está disponível para os seguintes serviços:

Posso testar esta funcionalidade com uma subscrição gratuita?

Não, a funcionalidade de autoescalação não está disponível para subscrições de nível livre.

Passos seguintes