Quotas e limites do serviço

2025-04-10

Este conteúdo aplica-se a:v4.0 (GA) | Versões anteriores:v3.1 (GA)v3.0 (GA)

Este conteúdo aplica-se a:marca de verificaçãoblue-checkmarkv4.0 (GA)

Este artigo contém uma referência rápida e uma descrição detalhada das Cotas e Limites do serviço Azure AI Document Intelligence para todos os níveis de preço. O documento também contém algumas práticas recomendadas para evitar a limitação de solicitações.

Utilização do modelo

Tipos de documentos suportados	Ler	Esquema	Modelos pré-construídos	Modelos personalizados	Capacidades adicionais
PDF	✔️	✔️	✔️	✔️	✔️
Imagens: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, , `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = suportado ✖️ = Não suportado

O Document Intelligence v4.0 2024-11-30 (GA) suporta funcionalidades de página e linha com as seguintes restrições:

Ângulo, largura/altura e unidade não são suportados.
Para cada objeto detetado, não há suporte para polígonos delimitadores ou regiões delimitadoras.
O lines objeto não é suportado.

Tipos de documentos suportados	Ler	Esquema	Modelos pré-construídos	Modelos personalizados
PDF	✔️	✔️	✔️	✔️
Imagens: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, , `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = suportado ✖️ = Não suportado

Faturação

O faturamento do Document Intelligence é calculado mensalmente com base no tipo de modelo e no número de páginas analisadas. Você pode encontrar métricas de uso no painel de métricas no portal do Azure. O painel exibe o número de páginas que o Azure AI Document Intelligence processa. Você pode verificar o custo estimado gasto no recurso usando a calculadora de preços do Azure. Para obter instruções detalhadas, consulte Verificar o uso e estimar o custo. Aqui estão alguns detalhes:

Quando você envia um documento para análise, o serviço analisa todas as páginas, a menos que você especifique um intervalo de páginas usando o pages parâmetro em sua solicitação. Quando o serviço analisa documentos do Microsoft Excel e PowerPoint através do modelo de leitura, OCR ou layout, ele conta cada planilha do Excel e slide do PowerPoint como uma página.
Quando o serviço analisa ficheiros PDF e TIFF, conta cada página no ficheiro PDF ou cada imagem no ficheiro TIFF como uma página sem limites máximos de caracteres.
Quando o serviço analisa arquivos do Microsoft Word e HTML suportados pelos modelos de leitura e layout, ele conta páginas em blocos de 3.000 caracteres cada. Por exemplo, se o documento contiver 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres totalizam três páginas.
Os modelos de leitura e layout não oferecem suporte à análise de imagens incorporadas ou vinculadas em arquivos do Microsoft Word, Excel, PowerPoint e HTML. Portanto, o serviço não as conta como imagens adicionadas.
Treinar um modelo personalizado é sempre gratuito com Document Intelligence. Os encargos são incorridos apenas quando o serviço usa um modelo para analisar um documento.
O preço do contêiner é o mesmo que o preço do serviço de nuvem.
O Document Intelligence oferece um nível gratuito (F0) onde você pode testar todos os recursos do Document Intelligence. Os limites de nível gratuito analisam a resposta apenas às duas primeiras páginas de uma solicitação.
A Document Intelligence tem um modelo de preços baseado em compromisso para grandes cargas de trabalho.
O modelo de layout é necessário para gerar rótulos para seu conjunto de dados para treinamento personalizado. Se o conjunto de dados que você usa para treinamento personalizado não tiver arquivos de rótulo disponíveis, o serviço os gerará para você e cobrará pelo uso do modelo de layout.

Quota	Grátis (F0)¹	Padrão (S0)
Analise o limite de transações por segundo	1	15 (valor padrão)
Ajustável	Não	^{Sim 2}
Obter limite de operações por segundo	1	50 (valor padrão)
Ajustável	Não	^{Sim 2}
Limite por segundo para operações de gestão de modelos	1	5 (valor padrão)
Ajustável	Não	^{Sim 2}
Limite de operações por segundo	1	10 (valor padrão)
Ajustável	Não	^{Sim 2}
Tamanho máximo do documento	4 MB	500 MB
Ajustável	Não	Não
Número máximo de páginas (Análise)	2	2000
Ajustável	Não	Não
Tamanho máximo do arquivo de etiquetas	10 MB	10 MB
Ajustável	Não	Não
Tamanho máximo da resposta ocr json	500 MB	500 MB
Ajustável	Não	Não
Número máximo de modelos padrão	500	5 000
Ajustável	Não	Não
Número máximo de modelos neurais	100	500
Ajustável	Não	Não

Utilização do modelo personalizado

Quota	Grátis (F0) ¹	Padrão (S0)
Limite do modelo de composição	5	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Neural e Generativo**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Neural e Generativo**	50 000	50.000 (valor padrão)
Ajustável	Não	Não
Trem de modelo neural personalizado	10 horas por mês ⁵	sem limite (pagar por hora), comece com 10 horas gratuitas por mês
Ajustável	Não	^{Sim 3}
*Número máximo de páginas (Formação) Classificador**	25,000	25.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documentos (classes) Classificador**	1000	1000 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1GB	2GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de amostras por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Utilização do modelo personalizado

Quota	Grátis (F0) ¹	Padrão (S0)
Limite do modelo de composição	5	200 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Neural**	50 000	50.000 (valor padrão)
Ajustável	Não	Não
Trem de modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	^{Sim 3}
*Número máximo de páginas (Formação) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documentos (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1GB	1GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de amostras por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Utilização do modelo personalizado

Quota	Grátis (F0) ¹	Padrão (S0)
Limite do modelo de composição	5	200 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Neural**	50 000	50.000 (valor padrão)
Ajustável	Não	Não
Trem de modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	^{Sim 3}
*Número máximo de páginas (Formação) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documentos (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1GB	1GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de amostras por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Limites de modelo personalizado

Quota	Grátis (F0) ¹	Padrão (S0)
Limite do modelo de composição	5	200 (valor padrão)
Ajustável	Não	Não
Tamanho do conjunto de dados de treinamento	50 MB	50 MB (valor padrão)
Ajustável	Não	Não
Número máximo de páginas (Formação)	500	500 (valor padrão)
Ajustável	Não	Não

1 Para o nível de preços gratuito (F0), consulte também os subsídios mensais na página de preços.
2 Consulte as práticas recomendadas e as instruções de ajuste.
3 A contagem de treinamento de modelos neurais é redefinida a cada mês. Abra uma solicitação de suporte para aumentar o limite de treinamento mensal. A partir da API v4.0, as solicitações de treinamento acima de 20 solicitações em um mês são cobradas na camada de treinamento. Consulte os preços para obter detalhes.

4 Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de qualquer atualização relacionada à rotulagem.

5 Este limite aplica-se apenas a v 4.0 (2024-11-30 GA) modelos neurais personalizados. A partir de v 4.0, apoiamos a formação de documentos maiores por durações mais longas (até 10 horas gratuitamente e incorrendo em cobranças depois). Para obter mais informações, consulte a página do modelo neural personalizado.

Descrição detalhada, ajuste de cota e práticas recomendadas

Os limites padrão podem ser estendidos solicitando um aumento por meio de um tíquete de suporte. Antes de pedir um aumento de quota (quando aplicável), confirme que é necessário. O serviço de Inteligência Documental usa o dimensionamento automático para trazer os recursos on-demandcomputacionais necessários, manter os custos do cliente baixos e desprovisionar recursos não utilizados por não manter uma quantidade excessiva de capacidade de hardware.

Se o seu aplicativo retornar o Código de resposta 429 (muitas solicitações), você está acima do limite para um ou mais dos limites de transações por segundo (TPS):

Limite de transações por segundo para análise O limite de TPS para enviar solicitações de análise (POST)
Obter limite de operações por segundo O TPS para obtenção de resultados em operações de análise (GET)
Limite de operações por segundo no gerenciamento de modelos Operações relacionadas ao gerenciamento de modelos, como compilação/treinamento e cópia.
Limite de operações de listagem por segundo Operações relacionadas com modelos de listagem, operações.

Práticas recomendadas gerais para mitigar a regulação durante o dimensionamento automático

Para minimizar problemas relacionados com a limitação (Código de resposta 429), recomendamos a utilização das seguintes técnicas:

Implementar a lógica de repetição na aplicação.
Evite alterações acentuadas na carga de trabalho. Aumente a carga de trabalho gradualmente
Exemplo. Seu aplicativo está usando Document Intelligence e sua carga de trabalho atual é de 10 TPS (transações por segundo). No segundo seguinte, você aumenta a carga para 40 TPS. O resultado é um código de resposta 429 para algumas solicitações, pois você está acima do limite de 15 TPS para enviar operações de análise. Você pode recuar do processamento para ficar abaixo dos 15 TPS ou solicitar um aumento no TPS para suportar seus volumes mais altos.

As secções seguintes descrevem casos específicos de ajustamento de quotas. Ir para o Document Intelligence: aumentando o limite de solicitações simultâneas

Aumentar o limite de transações por segundo de solicitação

Por predefinição, o número de transações por segundo está limitado a 15 transações por segundo para um recurso de Inteligência de Documentos. Para o escalão de preço Standard, este valor pode ser aumentado. Antes de submeter o pedido, verifique se está familiarizado com o material desta secção e consciente destas melhores práticas.

O primeiro passo seria habilitar o dimensionamento automático. Siga este documento para habilitar o dimensionamento automático em seu recurso * habilitar o dimensionamento automático. Com o dimensionamento automático habilitado, seu recurso pode continuar a aceitar solicitações acima dos limites de TPS configurados se houver capacidade no serviço. Ainda pode resultar em restrição de pedidos.

Aumentar o limite de solicitação simultânea não afeta diretamente seus custos. O serviço de Inteligência Documental usa o modelo "Pague apenas pelo que você usa". O limite define até que ponto o Serviço pode ser dimensionado antes de começar a controlar suas solicitações.

O valor existente de diferentes categorias de limite de solicitação está disponível no portal do Azure, na guia monitoramento na folha de visão geral do recurso.

Criar e enviar solicitação de suporte para aumento de TPS

Inicie o aumento do limite de transações por segundo (TPS) para o seu recurso enviando a Solicitação de Suporte:

Inicie sessão no portal do Azure
Selecione o recurso de inteligência documental para o qual você gostaria de aumentar o limite de TPS
Selecione -Nova solicitação de suporte- (-Suporte + solução de problemas- grupo). Uma nova janela é exibida com informações preenchidas automaticamente sobre sua Assinatura do Azure e o Recurso do Azure
Introduza -Resumo- (como "Aumentar o limite de TPS do Document Intelligence")
Selecione "Validação de cota ou uso" para o campo de tipo de problema.
Selecione -Próximo: Soluções-
Prossiga com a criação do pedido
Insira as seguintes informações no campo -Descrição-, na guia Detalhes:
- Nota: o pedido refere-se à quota de Inteligência Documental.
- Fornece uma expectativa de TPS que pretendes escalar para atingir. Embora os aumentos de TPS sejam gratuitos, você só deve solicitar um TPS que seja razoável para sua carga de trabalho.
- Informações de recursos do Azure
- Conclua inserindo as informações necessárias e selecione o botão -Criar- na guia -Review + create-
- Anote o número do pedido de suporte nas notificações do portal do Azure. Aguarde pelo contato do suporte em breve para dar seguimento ao seu caso.

Exemplo de uma prática recomendada de padrão de carga de trabalho

Este exemplo apresenta a abordagem que recomendamos seguir para mitigar a possível limitação de solicitações devido ao facto de o Autoscaling estar em andamento. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.

Vamos supor que um recurso de Document Intelligence tenha o limite padrão definido. Inicie a tarefa para enviar as suas solicitações de análise. Se você achar que está vendo uma limitação frequente com o código de resposta 429 ao verificar a conclusão, comece implementando um recuo exponencial na solicitação de resposta GET analyze. Usando um tempo de espera progressivamente maior entre novas tentativas para respostas de erro consecutivas, por exemplo, um padrão 2-5-13-34 de atrasos entre solicitações. Em geral, recomendamos não chamar a resposta get analyze mais de uma vez a cada 2 segundos para uma solicitação POST correspondente. A analyze resposta também contém um cabeçalho retry-after que indica quanto tempo deves esperar em segundos antes de verificar a conclusão dessa solicitação.

Se achares que estás a ser limitado no número de solicitações POST para documentos enviados, considera adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um grau mais alto de processamento simultâneo, você precisará criar uma solicitação de suporte para aumentar seus limites de serviço em transações por segundo.

Geralmente, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de ir para a produção.

Próximos passos

Saiba mais sobre códigos de erro e solução de problemas

Partilhar via

Quotas e limites do serviço

Utilização do modelo

Faturação

Utilização do modelo personalizado

Utilização do modelo personalizado

Utilização do modelo personalizado

Limites de modelo personalizado

Descrição detalhada, ajuste de cota e práticas recomendadas

Práticas recomendadas gerais para mitigar a regulação durante o dimensionamento automático

Aumentar o limite de transações por segundo de solicitação

Criar e enviar solicitação de suporte para aumento de TPS

Exemplo de uma prática recomendada de padrão de carga de trabalho

Próximos passos

Comentários

Recursos adicionais