Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Este conteúdo aplica-se a:marca de verificaçãoblue-checkmarkv4.0 (GA)
Este artigo contém uma referência rápida e uma descrição detalhada das Cotas e Limites do serviço Azure AI Document Intelligence para todos os níveis de preço. O documento também contém algumas práticas recomendadas para evitar a limitação de solicitações.
Utilização do modelo
Tipos de documentos suportados | Ler | Esquema | Modelos pré-construídos | Modelos personalizados | Capacidades adicionais |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Imagens: JPEG/JPG , PNG , BMP , TIFF , , HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = suportado ✖️ = Não suportado
O Document Intelligence v4.0 2024-11-30
(GA) suporta funcionalidades de página e linha com as seguintes restrições:
- Ângulo, largura/altura e unidade não são suportados.
- Para cada objeto detetado, não há suporte para polígonos delimitadores ou regiões delimitadoras.
- O
lines
objeto não é suportado.
Tipos de documentos suportados | Ler | Esquema | Modelos pré-construídos | Modelos personalizados |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Imagens: JPEG/JPG , PNG , BMP , TIFF , , HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = suportado ✖️ = Não suportado
Faturação
O faturamento do Document Intelligence é calculado mensalmente com base no tipo de modelo e no número de páginas analisadas. Você pode encontrar métricas de uso no painel de métricas no portal do Azure. O painel exibe o número de páginas que o Azure AI Document Intelligence processa. Você pode verificar o custo estimado gasto no recurso usando a calculadora de preços do Azure. Para obter instruções detalhadas, consulte Verificar o uso e estimar o custo. Aqui estão alguns detalhes:
Quando você envia um documento para análise, o serviço analisa todas as páginas, a menos que você especifique um intervalo de páginas usando o
pages
parâmetro em sua solicitação. Quando o serviço analisa documentos do Microsoft Excel e PowerPoint através do modelo de leitura, OCR ou layout, ele conta cada planilha do Excel e slide do PowerPoint como uma página.Quando o serviço analisa ficheiros PDF e TIFF, conta cada página no ficheiro PDF ou cada imagem no ficheiro TIFF como uma página sem limites máximos de caracteres.
Quando o serviço analisa arquivos do Microsoft Word e HTML suportados pelos modelos de leitura e layout, ele conta páginas em blocos de 3.000 caracteres cada. Por exemplo, se o documento contiver 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres totalizam três páginas.
Os modelos de leitura e layout não oferecem suporte à análise de imagens incorporadas ou vinculadas em arquivos do Microsoft Word, Excel, PowerPoint e HTML. Portanto, o serviço não as conta como imagens adicionadas.
Treinar um modelo personalizado é sempre gratuito com Document Intelligence. Os encargos são incorridos apenas quando o serviço usa um modelo para analisar um documento.
O preço do contêiner é o mesmo que o preço do serviço de nuvem.
O Document Intelligence oferece um nível gratuito (F0) onde você pode testar todos os recursos do Document Intelligence. Os limites de nível gratuito analisam a resposta apenas às duas primeiras páginas de uma solicitação.
A Document Intelligence tem um modelo de preços baseado em compromisso para grandes cargas de trabalho.
O modelo de layout é necessário para gerar rótulos para seu conjunto de dados para treinamento personalizado. Se o conjunto de dados que você usa para treinamento personalizado não tiver arquivos de rótulo disponíveis, o serviço os gerará para você e cobrará pelo uso do modelo de layout.
Quota | Grátis (F0)1 | Padrão (S0) |
---|---|---|
Analise o limite de transações por segundo | 1 | 15 (valor padrão) |
Ajustável | Não | Sim 2 |
Obter limite de operações por segundo | 1 | 50 (valor padrão) |
Ajustável | Não | Sim 2 |
Limite por segundo para operações de gestão de modelos | 1 | 5 (valor padrão) |
Ajustável | Não | Sim 2 |
Limite de operações por segundo | 1 | 10 (valor padrão) |
Ajustável | Não | Sim 2 |
Tamanho máximo do documento | 4 MB | 500 MB |
Ajustável | Não | Não |
Número máximo de páginas (Análise) | 2 | 2000 |
Ajustável | Não | Não |
Tamanho máximo do arquivo de etiquetas | 10 MB | 10 MB |
Ajustável | Não | Não |
Tamanho máximo da resposta ocr json | 500 MB | 500 MB |
Ajustável | Não | Não |
Número máximo de modelos padrão | 500 | 5 000 |
Ajustável | Não | Não |
Número máximo de modelos neurais | 100 | 500 |
Ajustável | Não | Não |
Utilização do modelo personalizado
Quota | Grátis (F0) 1 | Padrão (S0) |
---|---|---|
Limite do modelo de composição | 5 | 500 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Neural e Generativo | 1 GB 3 | 1 GB (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Modelo | 50 MB 4 | 50 MB (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Formação) * Modelo | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Treinamento) * Neural e Generativo | 50 000 | 50.000 (valor padrão) |
Ajustável | Não | Não |
Trem de modelo neural personalizado | 10 horas por mês 5 | sem limite (pagar por hora), comece com 10 horas gratuitas por mês |
Ajustável | Não | Sim 3 |
Número máximo de páginas (Formação) * Classificador | 25,000 | 25.000 (valor padrão) |
Ajustável | Não | Não |
Número máximo de tipos de documentos (classes) * Classificador | 1000 | 1000 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Classificador | 1GB | 2GB (valor padrão) |
Ajustável | Não | Não |
Número mínimo de amostras por classe * Classificador | 5 | 5 (valor padrão) |
Ajustável | Não | Não |
Utilização do modelo personalizado
Quota | Grátis (F0) 1 | Padrão (S0) |
---|---|---|
Limite do modelo de composição | 5 | 200 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Neural | 1 GB 3 | 1 GB (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Modelo | 50 MB 4 | 50 MB (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Formação) * Modelo | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Formação) * Neural | 50 000 | 50.000 (valor padrão) |
Ajustável | Não | Não |
Trem de modelo neural personalizado | 10 por mês | 20 por mês |
Ajustável | Não | Sim 3 |
Número máximo de páginas (Formação) * Classificador | 10.000 | 10.000 (valor padrão) |
Ajustável | Não | Não |
Número máximo de tipos de documentos (classes) * Classificador | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Classificador | 1GB | 1GB (valor padrão) |
Ajustável | Não | Não |
Número mínimo de amostras por classe * Classificador | 5 | 5 (valor padrão) |
Ajustável | Não | Não |
Utilização do modelo personalizado
Quota | Grátis (F0) 1 | Padrão (S0) |
---|---|---|
Limite do modelo de composição | 5 | 200 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Neural | 1 GB 3 | 1 GB (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Modelo | 50 MB 4 | 50 MB (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Formação) * Modelo | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Formação) * Neural | 50 000 | 50.000 (valor padrão) |
Ajustável | Não | Não |
Trem de modelo neural personalizado | 10 por mês | 20 por mês |
Ajustável | Não | Sim 3 |
Número máximo de páginas (Formação) * Classificador | 10.000 | 10.000 (valor padrão) |
Ajustável | Não | Não |
Número máximo de tipos de documentos (classes) * Classificador | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Classificador | 1GB | 1GB (valor padrão) |
Ajustável | Não | Não |
Número mínimo de amostras por classe * Classificador | 5 | 5 (valor padrão) |
Ajustável | Não | Não |
Limites de modelo personalizado
Quota | Grátis (F0) 1 | Padrão (S0) |
---|---|---|
Limite do modelo de composição | 5 | 200 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento | 50 MB | 50 MB (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Formação) | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
1 Para o nível de preços gratuito (F0), consulte também os subsídios mensais na página de preços.
2 Consulte as práticas recomendadas e as instruções de ajuste.
3 A contagem de treinamento de modelos neurais é redefinida a cada mês. Abra uma solicitação de suporte para aumentar o limite de treinamento mensal. A partir da API v4.0, as solicitações de treinamento acima de 20 solicitações em um mês são cobradas na camada de treinamento. Consulte os preços para obter detalhes.
4 Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de qualquer atualização relacionada à rotulagem.
5 Este limite aplica-se apenas a
v 4.0 (2024-11-30 GA)
modelos neurais personalizados. A partir dev 4.0
, apoiamos a formação de documentos maiores por durações mais longas (até 10 horas gratuitamente e incorrendo em cobranças depois). Para obter mais informações, consulte a página do modelo neural personalizado.
Descrição detalhada, ajuste de cota e práticas recomendadas
Os limites padrão podem ser estendidos solicitando um aumento por meio de um tíquete de suporte. Antes de pedir um aumento de quota (quando aplicável), confirme que é necessário. O serviço de Inteligência Documental usa o dimensionamento automático para trazer os recursos on-demand
computacionais necessários, manter os custos do cliente baixos e desprovisionar recursos não utilizados por não manter uma quantidade excessiva de capacidade de hardware.
Se o seu aplicativo retornar o Código de resposta 429 (muitas solicitações), você está acima do limite para um ou mais dos limites de transações por segundo (TPS):
- Limite de transações por segundo para análise O limite de TPS para enviar solicitações de análise (POST)
- Obter limite de operações por segundo O TPS para obtenção de resultados em operações de análise (GET)
- Limite de operações por segundo no gerenciamento de modelos Operações relacionadas ao gerenciamento de modelos, como compilação/treinamento e cópia.
- Limite de operações de listagem por segundo Operações relacionadas com modelos de listagem, operações.
Práticas recomendadas gerais para mitigar a regulação durante o dimensionamento automático
Para minimizar problemas relacionados com a limitação (Código de resposta 429), recomendamos a utilização das seguintes técnicas:
- Implementar a lógica de repetição na aplicação.
- Evite alterações acentuadas na carga de trabalho. Aumente a carga de trabalho gradualmente
Exemplo. Seu aplicativo está usando Document Intelligence e sua carga de trabalho atual é de 10 TPS (transações por segundo). No segundo seguinte, você aumenta a carga para 40 TPS. O resultado é um código de resposta 429 para algumas solicitações, pois você está acima do limite de 15 TPS para enviar operações de análise. Você pode recuar do processamento para ficar abaixo dos 15 TPS ou solicitar um aumento no TPS para suportar seus volumes mais altos.
As secções seguintes descrevem casos específicos de ajustamento de quotas. Ir para o Document Intelligence: aumentando o limite de solicitações simultâneas
Aumentar o limite de transações por segundo de solicitação
Por predefinição, o número de transações por segundo está limitado a 15 transações por segundo para um recurso de Inteligência de Documentos. Para o escalão de preço Standard, este valor pode ser aumentado. Antes de submeter o pedido, verifique se está familiarizado com o material desta secção e consciente destas melhores práticas.
O primeiro passo seria habilitar o dimensionamento automático. Siga este documento para habilitar o dimensionamento automático em seu recurso * habilitar o dimensionamento automático. Com o dimensionamento automático habilitado, seu recurso pode continuar a aceitar solicitações acima dos limites de TPS configurados se houver capacidade no serviço. Ainda pode resultar em restrição de pedidos.
Aumentar o limite de solicitação simultânea não afeta diretamente seus custos. O serviço de Inteligência Documental usa o modelo "Pague apenas pelo que você usa". O limite define até que ponto o Serviço pode ser dimensionado antes de começar a controlar suas solicitações.
O valor existente de diferentes categorias de limite de solicitação está disponível no portal do Azure, na guia monitoramento na folha de visão geral do recurso.
Criar e enviar solicitação de suporte para aumento de TPS
Inicie o aumento do limite de transações por segundo (TPS) para o seu recurso enviando a Solicitação de Suporte:
- Inicie sessão no portal do Azure
- Selecione o recurso de inteligência documental para o qual você gostaria de aumentar o limite de TPS
- Selecione -Nova solicitação de suporte- (-Suporte + solução de problemas- grupo). Uma nova janela é exibida com informações preenchidas automaticamente sobre sua Assinatura do Azure e o Recurso do Azure
- Introduza -Resumo- (como "Aumentar o limite de TPS do Document Intelligence")
- Selecione "Validação de cota ou uso" para o campo de tipo de problema.
- Selecione -Próximo: Soluções-
- Prossiga com a criação do pedido
- Insira as seguintes informações no campo -Descrição-, na guia Detalhes:
- Nota: o pedido refere-se à quota de Inteligência Documental.
- Fornece uma expectativa de TPS que pretendes escalar para atingir. Embora os aumentos de TPS sejam gratuitos, você só deve solicitar um TPS que seja razoável para sua carga de trabalho.
- Informações de recursos do Azure
- Conclua inserindo as informações necessárias e selecione o botão -Criar- na guia -Review + create-
- Anote o número do pedido de suporte nas notificações do portal do Azure. Aguarde pelo contato do suporte em breve para dar seguimento ao seu caso.
Exemplo de uma prática recomendada de padrão de carga de trabalho
Este exemplo apresenta a abordagem que recomendamos seguir para mitigar a possível limitação de solicitações devido ao facto de o Autoscaling estar em andamento. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.
Vamos supor que um recurso de Document Intelligence tenha o limite padrão definido. Inicie a tarefa para enviar as suas solicitações de análise. Se você achar que está vendo uma limitação frequente com o código de resposta 429 ao verificar a conclusão, comece implementando um recuo exponencial na solicitação de resposta GET analyze. Usando um tempo de espera progressivamente maior entre novas tentativas para respostas de erro consecutivas, por exemplo, um padrão 2-5-13-34 de atrasos entre solicitações. Em geral, recomendamos não chamar a resposta get analyze mais de uma vez a cada 2 segundos para uma solicitação POST correspondente. A analyze
resposta também contém um cabeçalho retry-after que indica quanto tempo deves esperar em segundos antes de verificar a conclusão dessa solicitação.
Se achares que estás a ser limitado no número de solicitações POST para documentos enviados, considera adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um grau mais alto de processamento simultâneo, você precisará criar uma solicitação de suporte para aumentar seus limites de serviço em transações por segundo.
Geralmente, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de ir para a produção.