Quotas e limites do serviço

Artigo
01/20/2024

Este conteúdo aplica-se a:v4.0 (visualização)Versões anteriores:v3.1 (GA)v3.0 (GA) |

Este conteúdo aplica-se a:v2.1 Última versão:v4.0 (pré-visualização) |

Este artigo contém uma referência rápida e uma descrição detalhada das Cotas e Limites do serviço Azure AI Document Intelligence para todos os níveis de preço. Ele também contém algumas práticas recomendadas para evitar a limitação de solicitações.

Utilização do modelo

Tipos de documentos suportados	Lida	Esquema	Modelos pré-criados	Modelos personalizados
PDF	✔️	✔️	✔️	✔️
Imagens (JPEG/JPG), PNG, BMP, TIFF, HEIF	✔️	✔️	✔️	✔️
Tipos de ficheiro do Office DOCX, PPTX, XLS	✔️	✖️	✖️	✖️

Tipos de documentos suportados	Lida	Esquema	Modelos pré-criados	Modelos personalizados
PDF	✔️	✔️	✔️	✔️
Imagens (JPEG/JPG), PNG, BMP, TIFF, HEIF	✔️	✔️	✔️	✔️
Tipos de ficheiro do Office DOCX, PPTX, XLS	✔️	✔️	✖️	✖️

Quota	Grátis (F0)¹	Padrão (S0)
Limite de transações por segundo	5	15 (valor padrão)
Ajustável	Não	^{Sim 2}
Tamanho máximo do documento	4 MB	500 MB
Ajustável	No	Não
Número máximo de páginas (Análise)	2	2000
Ajustável	No	Não
Tamanho máximo do arquivo de etiquetas	10 MB	10 MB
Ajustável	No	Não
Tamanho máximo da resposta ocr json	500 MB	500 MB
Ajustável	No	Não
Número máximo de modelos de modelo	500	5000
Ajustável	No	Não
Número máximo de modelos neurais	100	500
Ajustável	No	Não

Utilização do modelo personalizado

Quota	Grátis (F0) ¹	Padrão (S0)
Limite do modelo de composição	5	200 (valor padrão)
Ajustável	No	Não
*Tamanho do conjunto de dados de treinamento Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	No	Não
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	No	Não
*Número máximo de páginas (Formação) Modelo**	500	500 (valor padrão)
Ajustável	No	Não
*Número máximo de páginas (Treinamento) Neural**	50 000	50.000 (valor padrão)
Ajustável	No	Não
Trem de modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	^{Sim 3}
*Número máximo de páginas (Formação) Classificador**	10.000	10.000 (valor padrão)
Ajustável	No	Não
*Número máximo de tipos de documentos (classes) Classificador**	500	500 (valor padrão)
Ajustável	No	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1GB	1GB (valor padrão)
Ajustável	No	Não
*Número mínimo de amostras por classe Classificador**	5	5 (valor padrão)
Ajustável	No	Não

Limites de modelo personalizado

Quota	Grátis (F0) ¹	Padrão (S0)
Limite do modelo de composição	5	200 (valor padrão)
Ajustável	No	Não
Tamanho do conjunto de dados de treinamento	50 MB	50 MB (valor padrão)
Ajustável	No	Não
Número máximo de páginas (Formação)	500	500 (valor padrão)
Ajustável	No	Não

1 Para o nível de preços gratuito (F0), consulte também os subsídios mensais na página de preços.
2 Consulte as práticas recomendadas e [instruções de ajuste(#create-and-submit-support-request].
3 A contagem de treinamento de modelos neurais é redefinida a cada mês. Abra uma solicitação de suporte para aumentar o limite de treinamento mensal.

4 Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de qualquer atualização relacionada à rotulagem.

Descrição detalhada, ajuste de cota e práticas recomendadas

Antes de pedir um aumento de quota (quando aplicável), confirme que é necessário. O serviço de Inteligência Documental usa o dimensionamento automático para trazer os recursos computacionais necessários em "sob demanda" e, ao mesmo tempo, manter os custos do cliente baixos, desprovisionando recursos não utilizados por não manter uma quantidade excessiva de capacidade de hardware.

Se seu aplicativo retornar o Código de resposta 429 (muitas solicitações) e sua carga de trabalho estiver dentro dos limites definidos: muito provavelmente, o serviço está sendo dimensionado de acordo com sua demanda, mas ainda não atingiu a escala necessária. Assim, o serviço não tem imediatamente recursos suficientes para atender à solicitação. Este estado é transitório e não deve durar muito.

Práticas recomendadas gerais para reduzir a limitação durante o dimensionamento automático

Para minimizar problemas relacionados à limitação (Código de resposta 429), recomendamos o uso das seguintes técnicas:

Implementar lógica de repetição em seu aplicativo
Evite alterações acentuadas na carga de trabalho. Aumente a carga de trabalho gradualmente
Exemplo. Seu aplicativo está usando Document Intelligence e sua carga de trabalho atual é de 10 TPS (transações por segundo). No segundo seguinte, você aumenta a carga para 40 TPS (ou seja, quatro vezes mais). O Serviço começa imediatamente a ser dimensionado para atender à nova carga, mas provavelmente não pode fazê-lo em um segundo, então algumas das solicitações recebem o Código de Resposta 429.

As secções seguintes descrevem casos específicos de ajustamento de quotas. Ir para o Document Intelligence: aumentando o limite de solicitações simultâneas

Aumentar o limite de transações por segundo de solicitação

Por padrão, o número de transações por segundo é limitado a 15 transações por segundo para um recurso de Document Intelligence. Para o escalão de preço Standard, este valor pode ser aumentado. Antes de enviar a solicitação, verifique se você está familiarizado com o material desta seção e ciente dessas práticas recomendadas.

Aumentar o limite de solicitação simultânea não afeta diretamente seus custos. O serviço de Inteligência Documental usa o modelo "Pague apenas pelo que você usa". O limite define o quão alto o Serviço pode ser dimensionado antes de começar a limitar suas solicitações.

O valor existente do parâmetro de limite de solicitação simultânea não é visível por meio do portal do Azure, ferramentas de linha de comando ou solicitações de API. Para verificar o valor existente, crie um Pedido de Suporte do Azure.

Se quiser aumentar suas transações por segundo, você pode habilitar o dimensionamento automático em seu recurso. Siga este documento para habilitar o dimensionamento automático em seu recurso * habilitar o dimensionamento automático. Você também pode enviar uma solicitação de suporte TPS de aumento.

Tenha as informações necessárias prontas

ID do recurso de inteligência documental
País/Região
Como obter informações (Modelo base):
- Inicie sessão no portal do Azure
- Selecione o recurso de inteligência documental para o qual você gostaria de aumentar o limite de transação
- Selecionar Propriedades (grupo Gerenciamento de Recursos)
- Copie e salve os valores dos seguintes campos:
  - ID do recurso
  - Localização (sua região do ponto final)

Criar e enviar solicitação de suporte

Inicie o aumento do limite de transações por segundo (TPS) para o seu recurso enviando a Solicitação de Suporte:

Certifique-se de ter as informações necessárias
Inicie sessão no portal do Azure
Selecione o recurso de inteligência documental para o qual você gostaria de aumentar o limite de TPS
Selecione Nova solicitação de suporte (Suporte + grupo de solução de problemas )
Uma nova janela é exibida com informações preenchidas automaticamente sobre sua Assinatura do Azure e o Recurso do Azure
Insira o Resumo (como "Aumentar o limite de TPS da Document Intelligence")
Em Tipo de problema,* selecione "Validação de cota ou uso"
Selecione Next: Soluções
Prossiga com a criação do pedido
Na guia Detalhes, insira as seguintes informações no campo Descrição:
- uma nota, que o pedido é sobre cota de Inteligência Documental.
- Forneça uma expectativa de TPS que você gostaria de escalar para atender.
- Informações de recursos do Azure que você coletou.
- Conclua inserindo as informações necessárias e selecione o botão Criar na guia Revisar + criar
- Anote o número do pedido de suporte nas notificações do portal do Azure. Você será contatado em breve para processamento adicional

Exemplo de uma prática recomendada de padrão de carga de trabalho

Este exemplo apresenta a abordagem que recomendamos seguir para mitigar a possível limitação de solicitações devido ao Autoscaling estar em andamento. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.

Vamos supor que um recurso de Document Intelligence tenha o limite padrão definido. Inicie a carga de trabalho para enviar suas solicitações de análise. Se você achar que está vendo uma limitação frequente com o código de resposta 429, comece implementando um recuo exponencial na solicitação de resposta GET analyze. Usando um tempo de espera progressivamente maior entre novas tentativas para respostas de erro consecutivas, por exemplo, um padrão 2-5-13-34 de atrasos entre solicitações. Em geral, recomendamos não chamar a resposta get analyze mais de uma vez a cada 2 segundos para uma solicitação POST correspondente.

Se você achar que está sendo limitado no número de solicitações POST para documentos que estão sendo enviados, considere adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um grau mais alto de processamento simultâneo, você precisará criar uma solicitação de suporte para aumentar seus limites de serviço em transações por segundo.

Geralmente, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de ir para a produção.

Próximos passos

Saiba mais sobre códigos de erro e solução de problemas