Quotas e limites do serviço

Este conteúdo aplica-se a:v4.0 (visualização)Versões anteriores:blue-checkmarkcheckmarkv3.1 (GA)v3.0 (GA) | blue-checkmark

Este conteúdo aplica-se a:v2.1 Última versão:blue-checkmarkcheckmarkv4.0 (pré-visualização) |

Este artigo contém uma referência rápida e uma descrição detalhada das Cotas e Limites do serviço Azure AI Document Intelligence para todos os níveis de preço. Ele também contém algumas práticas recomendadas para evitar a limitação de solicitações.

Utilização do modelo

Tipos de documentos suportados Lida Esquema Modelos pré-criados Modelos personalizados
PDF ✔️ ✔️ ✔️ ✔️
Imagens (JPEG/JPG), PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Tipos de ficheiro do Office DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️
Tipos de documentos suportados Lida Esquema Modelos pré-criados Modelos personalizados
PDF ✔️ ✔️ ✔️ ✔️
Imagens (JPEG/JPG), PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Tipos de ficheiro do Office DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️
Quota Grátis (F0)1 Padrão (S0)
Limite de transações por segundo 5 15 (valor padrão)
Ajustável Não Sim 2
Tamanho máximo do documento 4 MB 500 MB
Ajustável No Não
Número máximo de páginas (Análise) 2 2000
Ajustável No Não
Tamanho máximo do arquivo de etiquetas 10 MB 10 MB
Ajustável No Não
Tamanho máximo da resposta ocr json 500 MB 500 MB
Ajustável No Não
Número máximo de modelos de modelo 500 5000
Ajustável No Não
Número máximo de modelos neurais 100 500
Ajustável No Não

Utilização do modelo personalizado

Quota Grátis (F0) 1 Padrão (S0)
Limite do modelo de composição 5 200 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Neural 1 GB 3 1 GB (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável No Não
Número máximo de páginas (Formação) * Modelo 500 500 (valor padrão)
Ajustável No Não
Número máximo de páginas (Treinamento) * Neural 50 000 50.000 (valor padrão)
Ajustável No Não
Trem de modelo neural personalizado 10 por mês 20 por mês
Ajustável Não Sim 3
Número máximo de páginas (Formação) * Classificador 10.000 10.000 (valor padrão)
Ajustável No Não
Número máximo de tipos de documentos (classes) * Classificador 500 500 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento * Classificador 1GB 1GB (valor padrão)
Ajustável No Não
Número mínimo de amostras por classe * Classificador 5 5 (valor padrão)
Ajustável No Não

Limites de modelo personalizado

Quota Grátis (F0) 1 Padrão (S0)
Limite do modelo de composição 5 200 (valor padrão)
Ajustável No Não
Tamanho do conjunto de dados de treinamento 50 MB 50 MB (valor padrão)
Ajustável No Não
Número máximo de páginas (Formação) 500 500 (valor padrão)
Ajustável No Não

1 Para o nível de preços gratuito (F0), consulte também os subsídios mensais na página de preços.
2 Consulte as práticas recomendadas e [instruções de ajuste(#create-and-submit-support-request].
3 A contagem de treinamento de modelos neurais é redefinida a cada mês. Abra uma solicitação de suporte para aumentar o limite de treinamento mensal.

4 Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de qualquer atualização relacionada à rotulagem.

Descrição detalhada, ajuste de cota e práticas recomendadas

Antes de pedir um aumento de quota (quando aplicável), confirme que é necessário. O serviço de Inteligência Documental usa o dimensionamento automático para trazer os recursos computacionais necessários em "sob demanda" e, ao mesmo tempo, manter os custos do cliente baixos, desprovisionando recursos não utilizados por não manter uma quantidade excessiva de capacidade de hardware.

Se seu aplicativo retornar o Código de resposta 429 (muitas solicitações) e sua carga de trabalho estiver dentro dos limites definidos: muito provavelmente, o serviço está sendo dimensionado de acordo com sua demanda, mas ainda não atingiu a escala necessária. Assim, o serviço não tem imediatamente recursos suficientes para atender à solicitação. Este estado é transitório e não deve durar muito.

Práticas recomendadas gerais para reduzir a limitação durante o dimensionamento automático

Para minimizar problemas relacionados à limitação (Código de resposta 429), recomendamos o uso das seguintes técnicas:

  • Implementar lógica de repetição em seu aplicativo
  • Evite alterações acentuadas na carga de trabalho. Aumente a carga de trabalho gradualmente
    Exemplo. Seu aplicativo está usando Document Intelligence e sua carga de trabalho atual é de 10 TPS (transações por segundo). No segundo seguinte, você aumenta a carga para 40 TPS (ou seja, quatro vezes mais). O Serviço começa imediatamente a ser dimensionado para atender à nova carga, mas provavelmente não pode fazê-lo em um segundo, então algumas das solicitações recebem o Código de Resposta 429.

As secções seguintes descrevem casos específicos de ajustamento de quotas. Ir para o Document Intelligence: aumentando o limite de solicitações simultâneas

Aumentar o limite de transações por segundo de solicitação

Por padrão, o número de transações por segundo é limitado a 15 transações por segundo para um recurso de Document Intelligence. Para o escalão de preço Standard, este valor pode ser aumentado. Antes de enviar a solicitação, verifique se você está familiarizado com o material desta seção e ciente dessas práticas recomendadas.

Aumentar o limite de solicitação simultânea não afeta diretamente seus custos. O serviço de Inteligência Documental usa o modelo "Pague apenas pelo que você usa". O limite define o quão alto o Serviço pode ser dimensionado antes de começar a limitar suas solicitações.

O valor existente do parâmetro de limite de solicitação simultânea não é visível por meio do portal do Azure, ferramentas de linha de comando ou solicitações de API. Para verificar o valor existente, crie um Pedido de Suporte do Azure.

Se quiser aumentar suas transações por segundo, você pode habilitar o dimensionamento automático em seu recurso. Siga este documento para habilitar o dimensionamento automático em seu recurso * habilitar o dimensionamento automático. Você também pode enviar uma solicitação de suporte TPS de aumento.

Tenha as informações necessárias prontas

  • ID do recurso de inteligência documental

  • País/Região

  • Como obter informações (Modelo base):

    • Inicie sessão no portal do Azure
    • Selecione o recurso de inteligência documental para o qual você gostaria de aumentar o limite de transação
    • Selecionar Propriedades (grupo Gerenciamento de Recursos)
    • Copie e salve os valores dos seguintes campos:
      • ID do recurso
      • Localização (sua região do ponto final)

Criar e enviar solicitação de suporte

Inicie o aumento do limite de transações por segundo (TPS) para o seu recurso enviando a Solicitação de Suporte:

  • Certifique-se de ter as informações necessárias
  • Inicie sessão no portal do Azure
  • Selecione o recurso de inteligência documental para o qual você gostaria de aumentar o limite de TPS
  • Selecione Nova solicitação de suporte (Suporte + grupo de solução de problemas )
  • Uma nova janela é exibida com informações preenchidas automaticamente sobre sua Assinatura do Azure e o Recurso do Azure
  • Insira o Resumo (como "Aumentar o limite de TPS da Document Intelligence")
  • Em Tipo de problema,* selecione "Validação de cota ou uso"
  • Selecione Next: Soluções
  • Prossiga com a criação do pedido
  • Na guia Detalhes, insira as seguintes informações no campo Descrição:
    • uma nota, que o pedido é sobre cota de Inteligência Documental.
    • Forneça uma expectativa de TPS que você gostaria de escalar para atender.
    • Informações de recursos do Azure que você coletou.
    • Conclua inserindo as informações necessárias e selecione o botão Criar na guia Revisar + criar
    • Anote o número do pedido de suporte nas notificações do portal do Azure. Você será contatado em breve para processamento adicional

Exemplo de uma prática recomendada de padrão de carga de trabalho

Este exemplo apresenta a abordagem que recomendamos seguir para mitigar a possível limitação de solicitações devido ao Autoscaling estar em andamento. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.

Vamos supor que um recurso de Document Intelligence tenha o limite padrão definido. Inicie a carga de trabalho para enviar suas solicitações de análise. Se você achar que está vendo uma limitação frequente com o código de resposta 429, comece implementando um recuo exponencial na solicitação de resposta GET analyze. Usando um tempo de espera progressivamente maior entre novas tentativas para respostas de erro consecutivas, por exemplo, um padrão 2-5-13-34 de atrasos entre solicitações. Em geral, recomendamos não chamar a resposta get analyze mais de uma vez a cada 2 segundos para uma solicitação POST correspondente.

Se você achar que está sendo limitado no número de solicitações POST para documentos que estão sendo enviados, considere adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um grau mais alto de processamento simultâneo, você precisará criar uma solicitação de suporte para aumentar seus limites de serviço em transações por segundo.

Geralmente, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de ir para a produção.

Próximos passos