Limites de dimensionamento automático dos serviços de IA
Este artigo fornece orientações sobre como os clientes podem acessar limites de taxa mais altos nos respectivos recursos dos serviços de IA do Azure.
Visão geral
Cada recurso dos serviços de IA do Azure tem uma taxa de chamada estática pré-configurada (transações por segundo) que limita o número de chamadas simultâneas que os clientes podem fazer para o serviço de back-end em um determinado período. O recurso de dimensionamento automático aumenta/diminui automaticamente os limites de taxa de um recurso do cliente com base nas métricas de uso do recurso quase em tempo real e nas métricas de capacidade do serviço de back-end.
Introdução ao recurso de dimensionamento automático
Esse recurso é desabilitado por padrão para todos os novos recursos. Siga estas instruções para habilitá-lo.
Vá para a página do recurso no portal do Azure e selecione a guia Visão geral no painel esquerdo. Na seção Essentials, localize a linha Dimensionamento Automático e selecione o link para exibir o painel Configurações de Dimensionamento Automático e habilitar o recurso.
Perguntas frequentes
Habilitar o recurso de dimensionamento automático significa que o recurso nunca mais será limitado?
Não, você ainda poderá receber erros de 429
por excesso de limite de taxa. Se o seu aplicativo disparar um pico e o seu recurso reportar uma resposta 429
, o dimensionamento automático irá verificar a seção de projeção de capacidade disponível para ver se a capacidade atual pode acomodar um aumento de limite de taxa e responder dentro de cinco minutos.
Se a capacidade disponível for suficiente para um aumento, o dimensionamento automático aumentará o limite de taxa do recurso gradualmente. Se você continuar chamando o recurso com uma taxa alta que resulta em mais limitação 429
, a taxa de TPS continuará aumentando ao longo do tempo. Se essa ação prosseguir por uma hora ou mais, você deverá atingir a taxa máxima (até 1.000 TPS) disponível para o recurso em questão naquele momento.
Se a capacidade disponível não for suficiente para um aumento, o recurso de dimensionamento automático aguardará cinco minutos e verificará novamente.
E se eu precisar de um limite de taxa padrão mais alto?
Por padrão, os recursos dos serviços de IA do Azure têm um limite de taxa padrão de 10 TPS. Se você precisar de um TPS padrão mais alto, envie um tíquete seguindo o link Nova Solicitação de Suporte na página do recurso no portal do Azure. Lembre-se de incluir uma justificativa comercial na solicitação.
Esse recurso aumentará meus gastos com o Azure?
Os preços dos serviços de IA do Azure não foram alterados e podem ser acessados aqui. Cobraremos apenas pelas chamadas às APIs dos serviços de IA do Azure que forem bem-sucedidas. No entanto, o aumento dos limites de taxa de chamadas significa que mais transações serão executadas e você poderá receber uma conta mais alta.
Esteja ciente de possíveis erros e suas consequências. Se um bug no aplicativo cliente fizer com que ele chame o serviço centenas de vezes por segundo, isso provavelmente gerará uma conta muito mais alta, enquanto o custo ficaria muito mais limitado com um limite de taxa fixo. Erros desse tipo são de sua responsabilidade. Recomendamos fortemente que, antes de usar o recurso de dimensionamento automático, você execute testes de desenvolvimento e atualização do cliente em um recurso com um limite de taxa fixo.
Poderei desabilitar esse recurso se preferir limitar a taxa em vez de ter gastos imprevisíveis?
Sim, você pode desabilitar o recurso de dimensionamento automático por meio do portal do Azure ou da CLI e retornar à configuração de limite de taxa de chamada padrão. Se tiver sido aprovado para um TPS padrão mais alto anteriormente, o recurso retornará para essa taxa. Pode levar até cinco minutos para que as alterações entrem em vigor.
Quais serviços dão suporte ao recurso de dimensionamento automático?
O recurso de dimensionamento automático está disponível para os seguintes serviços:
- Visão de IA do Azure
- Idioma (disponível apenas para análise de sentimento, extração de frases-chave, reconhecimento de entidade nomeada e análise de texto para integridade)
- Detector de Anomalias
- Content Moderator
- Visão Personalizada (previsão)
- Leitura Avançada
- LUIS
- Assistente de Métricas
- Personalizador
- QnAMaker
- Informação de documentos
Posso testar o recurso usando uma assinatura gratuita?
Não, o recurso de dimensionamento automático não está disponível para as assinaturas do tipo gratuito.
Próximas etapas
- Planejar e gerenciar custos dos serviços de IA do Azure.
- Otimizar seu investimento na nuvem com o Gerenciamento de Custos do Azure.
- Saiba mais sobre como evitar custos inesperados.
- Faça o curso de aprendizado orientado Gerenciamento de Custos.