Limites de serviço para a Linguagem da IA do Azure
Nota
Este artigo descreve apenas os limites para recursos pré-configurados no Azure AI Language: Para ver os limites de serviço para recursos personalizáveis, consulte os seguintes artigos:
Use este artigo para encontrar os limites para o tamanho e as taxas que você pode enviar dados para os seguintes recursos do serviço de idioma.
- Reconhecimento de entidade nomeada (NER)
- Deteção de informações pessoalmente identificáveis (PII)
- Extração de expressões-chave
- Associação de entidades
- Análise de texto para a saúde
- Análise de sentimento e mineração de opinião
- Deteção de idioma
Ao usar os recursos do serviço linguístico, tenha em mente as seguintes informações:
- O preço é independente de dados ou limites de taxa. O preço é baseado no número de registros de texto que você envia para a API e está sujeito aos detalhes de preços do seu recurso de idioma.
- Um registro de texto é medido como 1000 caracteres.
- Os limites de dados e taxa são baseados no número de documentos enviados para a API. Se precisar analisar documentos maiores do que o limite permite, você pode dividir o texto em pedaços menores de texto antes de enviá-los para a API.
- Um documento é uma única cadeia de caracteres de texto.
Máximo de caracteres por documento
O limite a seguir especifica o número máximo de caracteres que podem estar em um único documento.
Caraterística | Value |
---|---|
Análise de Texto para a saúde | 125.000 caracteres medidos por StringInfo.LengthInTextElements. |
Todos os outros recursos pré-configurados (síncronos) | 5.120 conforme medido por StringInfo.LengthInTextElements. Se você precisar enviar documentos maiores, considere usar o recurso de forma assíncrona. |
Todos os outros recursos pré-configurados (assíncronos) | 125.000 caracteres em todos os documentos enviados, conforme medido por StringInfo.LengthInTextElements (máximo de 25 documentos). |
Se um documento exceder o limite de caracteres, a API se comportará de forma diferente, dependendo de como você está enviando solicitações.
Se você estiver enviando solicitações de forma síncrona:
- A API não processa documentos que excedem o tamanho máximo e retorna um erro de documento inválido para ele. Se uma solicitação de API tiver vários documentos, a API continuará processando-os se eles estiverem dentro do limite de caracteres.
Se você estiver enviando solicitações de forma assíncrona:
- A API rejeita a solicitação inteira e retorna um
400 bad request
erro se qualquer documento dentro dela exceder o tamanho máximo.
Tamanho máximo do pedido
O limite a seguir especifica o tamanho máximo dos documentos contidos em toda a solicitação.
Caraterística | Value |
---|---|
Todos os recursos pré-configurados | 1 MB |
Máximo de documentos por pedido
Exceder os limites de documentos a seguir gera um código de erro HTTP 400.
Nota
Ao enviar solicitações de API assíncronas, você pode enviar um máximo de 25 documentos por solicitação.
Caraterística | Máximo de documentos por solicitação |
---|---|
Resumo da conversação | 1 |
Deteção de Idioma | 1000 |
Análise de Sentimentos | 10 |
Mineração de Opinião | 10 |
Extração de Expressões-Chave | 10 |
Reconhecimento de Entidades Nomeadas (NER) | 5 |
Deteção de informações de identificação pessoal (PII) | 5 |
Resumo de documentos | 25 |
Associação de Entidades | 5 |
Análise de Texto para a saúde | 25 para a API baseada na Web, 1000 para o contêiner. (125.000 caracteres no total) |
Limites de taxa
O seu limite de tarifa varia de acordo com o seu nível de preço. Esses limites são os mesmos para ambas as versões da API. Esses limites de taxa não se aplicam ao contêiner Análise de Texto para integridade, que não tem um limite de taxa definido.
Escalão de serviço | Pedidos por segundo | Pedidos por minuto |
---|---|---|
S / Multi-serviço | 1000 | 1000 |
S0 / F0 | 100 | 300 |
As taxas de solicitações são medidas para cada recurso separadamente. Você pode enviar o número máximo de solicitações para seu nível de preço para cada recurso, ao mesmo tempo. Por exemplo, se você estiver na S
camada e enviar 1000 solicitações de uma só vez, não poderá enviar outra solicitação por 59 segundos.