Limites de service pour Azure AI Language

Notes

Cet article décrit uniquement les limites des fonctionnalités préconfigurées dans Azure AI Language : pour voir les limites de service des fonctionnalités personnalisables, consultez les articles suivants :

Découvrez dans cet article les limites de taille et de débit auxquelles vous êtes soumis pour l’envoi de données aux fonctionnalités suivantes du service de langage.

Lorsque vous utilisez les fonctionnalités du service de langage, gardez à l’esprit les informations suivantes :

  • La tarification est indépendante des limites de données ou de débit. Celle-ci dépend du nombre d’enregistrements texte envoyés à l’API. Elle est soumise aux informations tarifaires de la ressource Langage.
    • Un enregistrement texte correspond à 1 000 caractères.
  • Les limites de données et de débit dépendent du nombre de documents envoyés à l’API. Si vous avez besoin d’analyser des documents plus volumineux que la limite autorisée, vous pouvez scinder le texte en blocs de texte plus petits avant de les envoyer à l’API.
  • Un document est une chaîne unique de caractères de texte.

Nombre maximal de caractères par document

La limite suivante spécifie le nombre maximal de caractères pouvant figurer dans un seul document.

Fonctionnalité Valeur
Analyse de texte pour la santé 125 000 caractères mesurés par StringInfo.LengthInTextElements.
Toutes les autres fonctionnalités préconfigurées (synchrones) 5 120 caractères mesurés par StringInfo.LengthInTextElements. Si vous devez soumettre des documents plus volumineux, envisagez d’utiliser la fonctionnalité de manière asynchrone.
Toutes les autres fonctionnalités préconfigurées (asynchrones) 125 000 caractères pour tous les documents envoyés, mesurés par StringInfo.LengthInTextElements (25 documents au maximum).

Si un document dépasse la limite de caractères, l’API se comporte différemment selon la façon dont vous envoyez les requêtes.

Si vous envoyez des requêtes de façon synchrone :

  • L’API ne traite pas les documents qui dépassent la taille maximale et retourne une erreur de document non valide. Si une demande d’API a plusieurs documents, l’API continue de les traiter s’ils sont dans la limite de caractères.

Si vous envoyez des requêtes de façon asynchrone :

  • L’API rejette l’intégralité de la demande et retourne une erreur 400 bad request si un document qu’elle contient dépasse la taille maximale.

Taille maximale de la requête

La limite suivante spécifie la taille maximale des documents contenus dans l’ensemble de la requête.

Fonctionnalité Valeur
Toutes les fonctionnalités préconfigurées 1 Mo

Nombre maximal de documents par requête

Le dépassement des limites pour les documents suivants a pour effet de générer un code d’erreur HTTP 400.

Notes

Lors de l’envoi de requêtes d’API asynchrones, vous pouvez envoyer un maximum de 25 documents par requête.

Fonctionnalité Nombre maximal de documents par demande
Résumé de conversation 1
Détection de la langue 1 000
Analyse des sentiments 10
Exploration des opinions 10
Extraction d’expressions clés 10
Reconnaissance d’entité nommée (NER) 5
Détection des informations d’identification personnelle (PII) 5
Résumé du document 25
Liaison d’entités 5
Analyse de texte pour la santé 25 pour l’API web, 1 000 pour le conteneur. (125 000 caractères au total)

Limites du taux de transfert

Votre limite de débit varie en fonction de votre niveau tarifaire. Ces limites sont les mêmes pour les deux versions de l’API. Ces limites du taux de transfert ne s’appliquent pas à l’Analyse de texte pour le conteneur d’intégrité démuni de limite définie du taux d’intégrité.

Niveau Demandes par seconde Requêtes par minute
S / Multiservice 1 000 1 000
S0 / F0 100 300

Les taux de requêtes sont mesurées séparément pour chaque fonctionnalité. Vous pouvez envoyer le nombre maximal de demandes correspondant à votre niveau tarifaire pour chaque fonctionnalité en même temps. Par exemple, si vous êtes dans le niveau S et que vous envoyez 1 000 demandes à la fois, vous ne pouvez pas envoyer une autre demande pendant 59 secondes.

Voir aussi