Eventos
Crie aplicativos e agentes de IA
17 de mar., 21 - 21 de mar., 10
Junte-se à série de encontros para criar soluções de IA escaláveis com base em casos de uso do mundo real com outros desenvolvedores e especialistas.
Registrar agoraNão há mais suporte para esse navegador.
Atualize o Microsoft Edge para aproveitar os recursos, o suporte técnico e as atualizações de segurança mais recentes.
Este artigo fornece orientações sobre como os clientes podem acessar limites de taxa mais altos em determinados recursos dos serviços de IA do Azure.
Cada recurso dos serviços de IA do Azure tem uma taxa de chamada estática pré-configurada (transações por segundo) que limita o número de chamadas simultâneas que os clientes podem fazer para o serviço de back-end em um determinado período. O recurso de dimensionamento automático aumenta/diminui automaticamente os limites de taxa de um recurso do cliente com base nas métricas de uso do recurso quase em tempo real e nas métricas de capacidade do serviço de back-end.
Esse recurso é desabilitado por padrão para todos os novos recursos. Se o recurso der suporte ao dimensionamento automático, siga estas instruções para habilitá-lo:
Vá para a página do recurso no portal do Azure e selecione a guia Visão geral no painel esquerdo. Na seção Essentials, localize a linha Dimensionamento Automático e selecione o link para exibir o painel Configurações de Dimensionamento Automático e habilitar o recurso.
O recurso de dimensionamento automático está disponível no nível de assinatura paga dos seguintes serviços:
Não, o recurso de dimensionamento automático não está disponível para as assinaturas do tipo gratuito.
Não, você ainda poderá receber erros de 429
por excesso de limite de taxa. Se o seu aplicativo disparar um pico e o seu recurso reportar uma resposta 429
, o dimensionamento automático irá verificar a seção de projeção de capacidade disponível para ver se a capacidade atual pode acomodar um aumento de limite de taxa e responder dentro de cinco minutos.
Se a capacidade disponível for suficiente para um aumento, o dimensionamento automático aumentará o limite de taxa do recurso gradualmente. Se você continuar chamando o recurso com uma taxa alta que resulta em mais limitação 429
, a taxa de TPS continuará aumentando ao longo do tempo. Se essa ação prosseguir por uma hora ou mais, você deverá atingir a taxa máxima (até 1.000 TPS) disponível para o recurso em questão naquele momento.
Se a capacidade disponível não for suficiente para um aumento, o recurso de dimensionamento automático aguardará cinco minutos e verificará novamente.
Por padrão, os recursos dos serviços de IA do Azure têm um limite de taxa padrão de 10 TPS. Se você precisar de um TPS padrão mais alto, envie um tíquete seguindo o link Nova Solicitação de Suporte na página do recurso no portal do Azure. Lembre-se de incluir uma justificativa comercial na solicitação.
Os preços dos serviços de IA do Azure não foram alterados e podem ser acessados aqui. Cobraremos apenas pelas chamadas às APIs dos serviços de IA do Azure que forem bem-sucedidas. No entanto, o aumento dos limites de taxa de chamadas significa que mais transações serão executadas e você poderá receber uma conta mais alta.
Esteja ciente de possíveis erros e suas consequências. Se um bug no aplicativo cliente fizer com que ele chame o serviço centenas de vezes por segundo, isso provavelmente gerará uma conta muito mais alta, enquanto o custo ficaria muito mais limitado com um limite de taxa fixo. Erros desse tipo são de sua responsabilidade. Recomendamos fortemente que, antes de usar o recurso de dimensionamento automático, você execute testes de desenvolvimento e atualização do cliente em um recurso com um limite de taxa fixo.
Sim, você pode desabilitar o recurso de dimensionamento automático por meio do portal do Azure ou da CLI e retornar à configuração de limite de taxa de chamada padrão. Se tiver sido aprovado para um TPS padrão mais alto anteriormente, o recurso retornará para essa taxa. Pode levar até cinco minutos para que as alterações entrem em vigor.
Eventos
Crie aplicativos e agentes de IA
17 de mar., 21 - 21 de mar., 10
Junte-se à série de encontros para criar soluções de IA escaláveis com base em casos de uso do mundo real com outros desenvolvedores e especialistas.
Registrar agoraTreinamento
Módulo
Responda a períodos de alta atividade acrescentando recursos de maneira incremental. Em seguida, remova esses recursos quando a atividade diminuir, para reduzir custos.
Certificação
Microsoft Certified: Azure AI Engineer Associate - Certifications
Crie e implemente uma solução de IA do Azure usando os serviços de IA do Azure, a Pesquisa de IA do Azure e o OpenAI do Azure.
Documentação
Cotas e limites de serviço – Informação de Documentos - Azure AI services
Referência rápida, descrição detalhada e práticas recomendadas para trabalhar dentro de Cotas e Limites do serviço IA do Azure para Informação de Documentos
Solucionar problemas de latência com a API da Informação de Documentos - Azure AI services
Saiba mais sobre dicas de solução de problemas, soluções corretivas e práticas recomendadas para resolver problemas de latência da Informação de Documentos.
O que há de novo na Informação de Documentos? - Azure AI services
Conheça as atualizações mais recentes da API do Document Intelligence.