Compartilhar via


Limites de dimensionamento automático dos serviços de IA

Este artigo fornece orientações sobre como os clientes podem acessar limites de taxa mais altos nos respectivos recursos dos serviços de IA do Azure.

Visão geral

Cada recurso dos serviços de IA do Azure tem uma taxa de chamada estática pré-configurada (transações por segundo) que limita o número de chamadas simultâneas que os clientes podem fazer para o serviço de back-end em um determinado período. O recurso de dimensionamento automático aumenta/diminui automaticamente os limites de taxa de um recurso do cliente com base nas métricas de uso do recurso quase em tempo real e nas métricas de capacidade do serviço de back-end.

Introdução ao recurso de dimensionamento automático

Esse recurso é desabilitado por padrão para todos os novos recursos. Siga estas instruções para habilitá-lo.

Vá para a página do recurso no portal do Azure e selecione a guia Visão geral no painel esquerdo. Na seção Essentials, localize a linha Dimensionamento Automático e selecione o link para exibir o painel Configurações de Dimensionamento Automático e habilitar o recurso.

Captura de tela do portal do Azure com o painel de dimensionamento automático à direita.

Perguntas frequentes

Habilitar o recurso de dimensionamento automático significa que o recurso nunca mais será limitado?

Não, você ainda poderá receber erros de 429 por excesso de limite de taxa. Se o seu aplicativo disparar um pico e o seu recurso reportar uma resposta 429, o dimensionamento automático irá verificar a seção de projeção de capacidade disponível para ver se a capacidade atual pode acomodar um aumento de limite de taxa e responder dentro de cinco minutos.

Se a capacidade disponível for suficiente para um aumento, o dimensionamento automático aumentará o limite de taxa do recurso gradualmente. Se você continuar chamando o recurso com uma taxa alta que resulta em mais limitação 429, a taxa de TPS continuará aumentando ao longo do tempo. Se essa ação prosseguir por uma hora ou mais, você deverá atingir a taxa máxima (até 1.000 TPS) disponível para o recurso em questão naquele momento.

Se a capacidade disponível não for suficiente para um aumento, o recurso de dimensionamento automático aguardará cinco minutos e verificará novamente.

E se eu precisar de um limite de taxa padrão mais alto?

Por padrão, os recursos dos serviços de IA do Azure têm um limite de taxa padrão de 10 TPS. Se você precisar de um TPS padrão mais alto, envie um tíquete seguindo o link Nova Solicitação de Suporte na página do recurso no portal do Azure. Lembre-se de incluir uma justificativa comercial na solicitação.

Esse recurso aumentará meus gastos com o Azure?

Os preços dos serviços de IA do Azure não foram alterados e podem ser acessados aqui. Cobraremos apenas pelas chamadas às APIs dos serviços de IA do Azure que forem bem-sucedidas. No entanto, o aumento dos limites de taxa de chamadas significa que mais transações serão executadas e você poderá receber uma conta mais alta.

Esteja ciente de possíveis erros e suas consequências. Se um bug no aplicativo cliente fizer com que ele chame o serviço centenas de vezes por segundo, isso provavelmente gerará uma conta muito mais alta, enquanto o custo ficaria muito mais limitado com um limite de taxa fixo. Erros desse tipo são de sua responsabilidade. Recomendamos fortemente que, antes de usar o recurso de dimensionamento automático, você execute testes de desenvolvimento e atualização do cliente em um recurso com um limite de taxa fixo.

Poderei desabilitar esse recurso se preferir limitar a taxa em vez de ter gastos imprevisíveis?

Sim, você pode desabilitar o recurso de dimensionamento automático por meio do portal do Azure ou da CLI e retornar à configuração de limite de taxa de chamada padrão. Se tiver sido aprovado para um TPS padrão mais alto anteriormente, o recurso retornará para essa taxa. Pode levar até cinco minutos para que as alterações entrem em vigor.

Quais serviços dão suporte ao recurso de dimensionamento automático?

O recurso de dimensionamento automático está disponível para os seguintes serviços:

Posso testar o recurso usando uma assinatura gratuita?

Não, o recurso de dimensionamento automático não está disponível para as assinaturas do tipo gratuito.

Próximas etapas