Cotas e limites de serviço
Este conteúdo se aplica a:v4.0 (versão prévia) | Versões anteriores:v3.1 (disponibilidade geral)v3.0 (disponibilidade geral)
Este conteúdo se aplica a:v2.1 | Versão mais recente:v4.0 (versão prévia)
Esse artigo contém uma referência rápida e uma descrição detalhada das cotas e dos limites do serviço de IA do Azure para Informação de Documentos para todos as camadas de preços. Ele também contém algumas práticas recomendadas para evitar a limitação de solicitações.
Uso do modelo
Tipos de documento com suporte | Ler | Layout | Modelos predefinidos | Modelos personalizados |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Imagens (JPEG/JPG), PNG, BMP, TIFF, HEIF | ✔️ | ✔️ | ✔️ | ✔️ |
Tipos de arquivo do Office DOCX, PPTX, XLS | ✔️ | ✖️ | ✖️ | ✖️ |
Tipos de documento com suporte | Ler | Layout | Modelos predefinidos | Modelos personalizados |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Imagens (JPEG/JPG), PNG, BMP, TIFF, HEIF | ✔️ | ✔️ | ✔️ | ✔️ |
Tipos de arquivo do Office DOCX, PPTX, XLS | ✔️ | ✔️ | ✖️ | ✖️ |
Quota | Gratuito (F0)1 | Standard (S0) |
---|---|---|
Limite de transações por segundo | 1 | 15 (valor padrão) |
Ajustável | Não | Sim 2 |
Tamanho máximo do documento | 4 MB | 500 MB |
Ajustável | Não | Não |
Número máximo de páginas (Análise) | 2 | 2000 |
Ajustável | Não | Não |
Tamanho máximo do arquivo de rótulos | 10 MB | 10 MB |
Ajustável | Não | Não |
Tamanho máximo da resposta json do OCR | 500 MB | 500 MB |
Ajustável | Não | Não |
Número máximo de modelos | 500 | 5.000 |
Ajustável | Não | Não |
Número máximo de modelos neurais | 100 | 500 |
Ajustável | Não | Não |
Uso do modelo personalizado
Quota | Gratuito (F0)1 | Standard (S0) |
---|---|---|
Limite do Modelo de Composição | 5 | 200 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento *Neural | 1 GB 3 | 1 GB (valor padrão) |
Ajustável | Não | No |
Tamanho do conjunto de dados de treinamento * Modelo | 50 MB 4 | 50 MB (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Treinamento) * Modelo | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Treinamento) * Neural | 50.000 | 50,000 (valor padrão) |
Ajustável | Não | Não |
Treinar modelo neural personalizado | 10 por mês | 20 por mês |
Ajustável | Não | Sim 3 |
Número máximo de páginas (Treinamento) * Classificador | 10.000 | 10.000 (valor padrão) |
Ajustável | Não | Não |
Número máximo de tipos de documento (classes) * Classificador | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento * Classificador | 1 GB | 1 GB (valor padrão) |
Ajustável | Não | Não |
Número mínimo de exemplos por classe * Classificador | 5 | 5 (valor padrão) |
Ajustável | Não | Não |
Limites de modelo personalizado
Quota | Gratuito (F0)1 | Standard (S0) |
---|---|---|
Limite do Modelo de Composição | 5 | 200 (valor padrão) |
Ajustável | Não | Não |
Tamanho do conjunto de dados de treinamento | 50 MB | 50 MB (valor padrão) |
Ajustável | Não | Não |
Número máximo de páginas (Treinamento) | 500 | 500 (valor padrão) |
Ajustável | Não | Não |
1Para o tipo de preço Gratuito (F0) consulte também os subsídios mensais na página de preços.
2 Confira as melhores práticas e [instruções de ajuste(#create-and-submit-support-request).
3 A contagem de treinamento de modelos neurais é redefinida a cada mês do calendário. Abra uma solicitação de suporte para aumentar o limite mensal de treinamento.
4 Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de quaisquer atualizações relacionadas à rotulagem.
Descrição detalhada, ajuste de cota e práticas recomendadas
Antes de solicitar um aumento de cota (quando aplicável), verifique se ele é necessário. O serviço de Informação de Documentos usa dimensionamento automático para colocar os recursos computacionais necessários no modo sob demanda e, ao mesmo tempo, manter os custos do cliente baixos, desprovisionar recursos não utilizados ao não manter uma quantidade excessiva de capacidade de hardware.
Se seu aplicativo retornar o Código de Resposta 429 (Muitas solicitações) e sua carga de trabalho estiver dentro dos limites definidos, provavelmente, o serviço está escalando verticalmente para sua demanda, mas ainda não atingiu a escala necessária. Portanto, o serviço não tem de imediato os recursos suficientes para atender à solicitação. Esse estado é transitório e não deve durar pouco tempo.
Práticas recomendadas gerais para mitigar a limitação durante o dimensionamento automático
Para minimizar problemas relacionados à limitação (Código de Resposta 429), é recomendável o uso das seguintes técnicas:
- Implemente a lógica de repetição no seu aplicativo
- Evite alterações bruscas na carga de trabalho. Aumente a carga de trabalho gradualmente
Exemplo. O aplicativo está usando a Informação de Documentos e a carga de trabalho atual é 10 TPS (transações por segundo). No próximo segundo, você aumenta a carga para 40 TPS (ou seja, quatro vezes mais). O Serviço inicia imediatamente o dimensionamento para atender à nova carga, mas é provável que isso não seja possível dentro de um segundo. Portanto, algumas das solicitações recebem o Código de Resposta 429.
As seções a seguir descrevem casos específicos de ajuste de cotas. Avance para Informações de Documento: como aumentar o limite de solicitações simultâneas
Aumento do limite de solicitação de transações por segundo
Por padrão, o número de transações simultâneas por segundo é limitado a 15 transações por segundo para um recurso da Informação de Documentos. Para o tipo de preço Standard, esse valor pode sofrer aumento. Antes de enviar a solicitação, verifique se você já conhece o material nesta seção e está ciente das melhores práticas.
O aumento do limite de Solicitação Simultânea não afeta diretamente os custos. A Informação de Documentos usa o modelo "Pague apenas o que usar". O limite define até que ponto o Serviço pode ser escalado antes de começar a limitar as solicitações.
O valor existente do parâmetro de limite de Solicitação Simultânea não é visível por meio do portal do Azure, de ferramentas de linha de comando ou das solicitações de API. Para verificar o valor existente, crie uma Solicitação de Suporte do Azure.
Se quiser aumentar suas transações por segundo, você poderá habilitar o dimensionamento automático no recurso. Siga este documento para habilitar o dimensionamento automático em seu recurso: habilitar dimensionamento automático. Também é possível enviar uma solicitação de suporte de TPS.
Tenha as informações necessárias em mãos
ID do Recurso da Informação de Documentos
Region
Como obter as informações (modelo Básico) :
- Entre no Portal do Azure
- Selecione o recurso da Informação de Documentos para o qual deseja aumentar o limite de transação
- Selecione Propriedades (grupo deGerenciamento de Recursos )
- Copie e salve os valores dos seguintes campos:
- ID de Recurso
- Localização (sua Região do ponto de extremidade)
Criar e enviar solicitação de suporte
Inicie o aumento do limite de transações por segundo (TPS) para seu recurso enviando a Solicitação de Suporte:
- Não se esqueça de ter as informações necessárias
- Entre no Portal do Azure
- Selecione o recurso da Informação de Documentos para o qual deseja aumentar o limite de transação
- Selecione Nova solicitação de suporte (grupo Suporte + solução de problemas)
- Uma nova janela é exibida com as informações preenchidas automaticamente sobre sua assinatura do Azure e recurso do Azure
- Insira Resumo (como "Aumentar o limite de TPS da Informação de Documentos")
- Em Tipo de problema, selecione "Cota ou validação de uso"
- Selecione Avançar: Soluções
- Prossiga com a criação da solicitação
- Sob a guia Detalhes, insira as seguintes informações no campo Descrição:
- uma observação: a solicitação é sobre a cota da Informação de Documentos.
- Forneça uma expectativa de TPS que você gostaria de dimensionar para atender.
- Informações de recursos do Azure que você coletou.
- Conclua a inserção das informações necessárias e selecione o botão Criar na guia Revisar + criar
- Observe o número da solicitação de suporte nas notificações do portal do Azure. Você será contatado em breve para continuar o processamento
Exemplo de uma melhor prática de padrão de carga de trabalho
Este exemplo apresenta a abordagem que recomendamos a seguir para mitigar a possível limitação de solicitação devido ao Dimensionamento automático em andamento. Ele não é uma receita exata, mas meramente um modelo que pode ser seguido e ajustado conforme necessário.
Vamos supor que um recurso da Informação de Documentos tem o limite padrão definido. Inicie a carga de trabalho para enviar suas solicitações de análise. Se achar que está vendo uma limitação frequente com o código de resposta 429, comece implementando uma retirada exponencial na solicitação de resposta de análise GET. Usando um tempo de espera progressivamente maior entre as tentativas de respostas de erro consecutivas, por exemplo, um padrão de atrasos entre solicitações 2-5-13-34. Em geral, recomendamos não chamar a resposta de análise GET mais de uma vez a cada 2 segundos para uma solicitação POST correspondente.
Se achar que o número de solicitações POST está sendo restringido nos documentos que estão sendo enviados, considere adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um grau maior de processamento simultâneo, você precisa criar uma solicitação de suporte para aumentar os limites de serviço em transações por segundo.
Em geral, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de passar para a produção.