Limites de serviço para a Linguagem de IA do Azure

Observação

Este artigo descreve apenas os limites de recursos pré-configurados na Linguagem de IA do Azure: para ver os limites de serviços para recursos personalizáveis, confira os seguintes artigos:

Use este artigo para localizar os limites de tamanho e as tarifas para enviar dados para os seguintes recursos do serviço de linguagem.

Ao usar recursos do Serviço de linguagem, lembre-se das informações a seguir:

  • Os preços são independentes dos limites de dados ou de taxas. O preço é baseado no número de registros de texto que você envia para a API, e está sujeito aos detalhes de preços dos seus recursos de Linguagem.
    • Um registro de texto é medido como 1000 caracteres.
  • Os limites de dados e taxa se baseiam no número de documentos que você envia para a API. Se você precisar analisar documentos maiores do que o limite permite, poderá dividir o texto em partes menores antes de enviá-los para a API.
  • Um documento é uma cadeia de caracteres de texto.

Máximo de caracteres por documento

O limite a seguir especifica o número máximo de caracteres que podem estar em um único documento.

Recurso Valor
Análise de Texto para integridade 125.000 caracteres conforme medidos por StringInfo.LengthInTextElements.
Todos os outros recursos pré-configurados (síncronos) 5.120 caracteres conforme medido por StringInfo.LengthInTextElements. Se você precisar enviar documentos maiores, considere usar o recurso de forma assíncrona.
Todos os outros recursos pré-configurados (assíncronos) 125.000 caracteres em todos os documentos enviados, conforme medido por StringInfo.LengthInTextElements (máximo de 25 documentos).

Se um documento exceder o limite de caracteres, a API se comportará de maneira diferente, a depender de como as solicitações são enviadas.

Se você estiver enviando solicitações de forma síncrona:

  • A API não processa documentos que excedem o tamanho máximo e retorna um erro de documento inválido para cada um deles. Se uma solicitação de API tiver vários documentos, a API continuará a processá-los se estiverem dentro do limite de caracteres.

Se estiver enviando solicitações de forma assíncrona:

  • A API rejeita toda a solicitação e retorna um erro 400 bad request se qualquer documento dentro dela exceder o tamanho máximo.

Tamanho máximo de solicitação

O limite a seguir especifica o tamanho máximo dos documentos contidos em toda a solicitação.

Recurso Valor
Todos os recursos pré-configurados 1 MB

Máximo de documentos por solicitação

Exceder os limites de documentos a seguir gera um código de erro HTTP 400.

Observação

Ao enviar solicitações de API assíncronas, você pode enviar no máximo 25 documentos por solicitação.

Recurso Máximo de documentos por solicitação
Resumo de conversa 1
Detecção de Idioma 1000
Análise de Sentimento 10
Mineração de opiniões 10
Extração de Frases-Chave 10
NER (Reconhecimento de Entidade Nomeada) 5
Detecção de PII (informações de identificação pessoal) 5
Resumo de documento 25
Vinculação de Identidade 5
Análise de Texto para integridade 25 para a API baseada na Web, 1000 para o contêiner. (125.000 caracteres no total)

Limites de taxa

O limite de taxa varia de acordo com o tipo de preço. Esses limites são os mesmos para as duas versões da API. Esses limites de taxa não se aplicam à Análise de Texto do contêiner de integridade, que não tem um limite de taxa definido.

Camada Solicitações por segundo Solicitações por minuto
S/Vários serviços 1000 1000
S0/F0 100 300

As taxas de solicitações são calculadas separadamente para cada recurso. Você pode enviar o número máximo de solicitações do tipo de preço para cada recurso, ao mesmo tempo. Por exemplo, se você estiver na camada S e enviar 1.000 solicitações de uma vez, não poderá enviar outra solicitação por 59 segundos.

Confira também