Limites de serviços de IA de dimensionamento automático
Este artigo fornece orientação sobre como os clientes podem acessar limites de taxa mais altos em seus recursos de serviços de IA do Azure.
Descrição geral
Cada recurso de serviços de IA do Azure tem uma taxa de chamada estática pré-configurada (transações por segundo) que limita o número de chamadas simultâneas que os clientes podem fazer para o serviço de back-end em um determinado período de tempo. O recurso de dimensionamento automático aumentará/diminuirá automaticamente os limites de taxa de recursos de um cliente com base em métricas de uso de recursos quase em tempo real e métricas de capacidade de serviço de back-end.
Introdução ao recurso de dimensionamento automático
Esse recurso é desabilitado por padrão para cada novo recurso. Siga estas instruções para ativá-lo.
Vá para a página do seu recurso no portal do Azure e selecione a guia Visão geral no painel esquerdo. Na seção Essenciais, localize a linha Dimensionamento automático e selecione o link para exibir o painel Configurações de dimensionamento automático e habilitar o recurso.
Perguntas mais frequentes
Ativar o recurso de dimensionamento automático significa que meu recurso nunca mais será limitado?
Não, você ainda pode obter 429
erros por excesso de limite de taxa. Se seu aplicativo acionar um pico e seu recurso relatar uma 429
resposta, o dimensionamento automático verificará a seção de projeção de capacidade disponível para ver se a capacidade atual pode acomodar um aumento de limite de taxa e responder em cinco minutos.
Se a capacidade disponível for suficiente para um aumento, o dimensionamento automático aumenta gradualmente o limite de taxa do seu recurso. Se você continuar a chamar seu recurso a uma taxa alta que resulte em mais 429
limitação, sua taxa de TPS continuará a aumentar ao longo do tempo. Se essa ação continuar por uma hora ou mais, você deverá atingir a taxa máxima (até 1000 TPS) atualmente disponível naquele momento para esse recurso.
Se a capacidade disponível não for suficiente para um aumento, o recurso de dimensionamento automático aguarda cinco minutos e verifica novamente.
E se eu precisar de um limite de taxa de inadimplência mais alto?
Por padrão, os recursos de serviços de IA do Azure têm um limite de taxa padrão de 10 TPS. Se você precisar de um TPS padrão mais alto, envie um tíquete seguindo o link Nova Solicitação de Suporte na página do seu recurso no portal do Azure. Lembre-se de incluir uma justificação comercial no pedido.
Esse recurso aumentará meus gastos com o Azure?
O preço dos serviços de IA do Azure não foi alterado e pode ser acessado aqui. Só cobraremos por chamadas bem-sucedidas feitas para APIs de serviços de IA do Azure. No entanto, o aumento dos limites de taxa de chamadas significa que mais transações são concluídas e você pode receber uma fatura mais alta.
Esteja atento aos potenciais erros e às suas consequências. Se um bug em seu aplicativo cliente fizer com que ele chame o serviço centenas de vezes por segundo, isso provavelmente levaria a uma conta muito maior, enquanto o custo seria muito mais limitado sob um limite de taxa fixa. Erros deste tipo são da sua responsabilidade. É altamente recomendável que você execute testes de desenvolvimento e atualização de cliente em relação a um recurso com um limite de taxa fixa antes de usar o recurso de dimensionamento automático.
Posso desativar esse recurso se preferir limitar a taxa a ter gastos imprevisíveis?
Sim, você pode desabilitar o recurso de dimensionamento automático por meio do portal do Azure ou da CLI e retornar à sua configuração padrão de limite de taxa de chamada. Se o seu recurso foi aprovado anteriormente para um TPS padrão mais alto, ele volta para essa taxa. Pode levar até cinco minutos para que as alterações entrem em vigor.
Quais serviços suportam o recurso de dimensionamento automático?
O recurso Autoscale está disponível para os seguintes serviços:
- Azure AI Vision
- Linguagem (disponível apenas para análise de sentimento, extração de frases-chave, reconhecimento de entidades nomeadas e análise de texto para integridade)
- Detetor de anomalias
- Content Moderator
- Visão personalizada (previsão)
- Leitor imersivo
- LUIS
- Consultor de Métricas
- Personalizador
- QnAMaker
- Inteligência Documental
Posso testar esta funcionalidade utilizando uma subscrição gratuita?
Não, o recurso de dimensionamento automático não está disponível para assinaturas de nível gratuito.
Próximos passos
- Planeje e gerencie custos para serviços de IA do Azure.
- Otimize o seu investimento na nuvem com o Azure Cost Management.
- Saiba como evitar custos inesperados.
- Faça o curso de aprendizagem guiada em Gestão de Custos.