Limites de service pour Azure AI Language
Remarque
Cet article décrit uniquement les limites des fonctionnalités préconfigurées dans Azure AI Language : pour voir les limites de service des fonctionnalités personnalisables, consultez les articles suivants :
Découvrez dans cet article les limites de taille et de débit auxquelles vous êtes soumis pour l’envoi de données aux fonctionnalités suivantes du service de langage.
- Reconnaissance d’entité nommée (NER)
- Détection d’informations d’identification personnelle
- Extraction de phrases clés
- Liaison d’entités
- Analyse de texte pour la santé
- Analyse des sentiments et exploration des opinions
- Détection de la langue
Lorsque vous utilisez les fonctionnalités du service de langage, gardez à l’esprit les informations suivantes :
- La tarification est indépendante des limites de données ou de débit. Celle-ci dépend du nombre d’enregistrements texte envoyés à l’API. Elle est soumise aux informations tarifaires de la ressource Langage.
- Un enregistrement texte correspond à 1 000 caractères.
- Les limites de données et de débit dépendent du nombre de documents envoyés à l’API. Si vous avez besoin d’analyser des documents plus volumineux que la limite autorisée, vous pouvez scinder le texte en blocs de texte plus petits avant de les envoyer à l’API.
- Un document est une chaîne unique de caractères de texte.
Nombre maximal de caractères par document
La limite suivante spécifie le nombre maximal de caractères pouvant figurer dans un seul document.
Fonctionnalité | Valeur |
---|---|
Analyse de texte pour la santé | 125 000 caractères mesurés par StringInfo.LengthInTextElements. |
Toutes les autres fonctionnalités préconfigurées (synchrones) | 5 120 caractères mesurés par StringInfo.LengthInTextElements. Si vous devez soumettre des documents plus volumineux, envisagez d’utiliser la fonctionnalité de manière asynchrone. |
Toutes les autres fonctionnalités préconfigurées (asynchrones) | 125 000 caractères pour tous les documents envoyés, mesurés par StringInfo.LengthInTextElements (25 documents au maximum). |
Si un document dépasse la limite de caractères, l’API se comporte différemment selon la façon dont vous envoyez les requêtes.
Si vous envoyez des requêtes de façon synchrone :
- L’API ne traite pas les documents qui dépassent la taille maximale et retourne une erreur de document non valide. Si une demande d’API a plusieurs documents, l’API continue de les traiter s’ils sont dans la limite de caractères.
Si vous envoyez des requêtes de façon asynchrone :
- L’API rejette l’intégralité de la demande et retourne une erreur
400 bad request
si un document qu’elle contient dépasse la taille maximale.
Taille maximale de la requête
La limite suivante spécifie la taille maximale des documents contenus dans l’ensemble de la requête.
Fonctionnalité | Valeur |
---|---|
Toutes les fonctionnalités préconfigurées | 1 Mo |
Nombre maximal de documents par requête
Le dépassement des limites pour les documents suivants a pour effet de générer un code d’erreur HTTP 400.
Notes
Lors de l’envoi de requêtes d’API asynchrones, vous pouvez envoyer un maximum de 25 documents par requête.
Fonctionnalité | Nombre maximal de documents par demande |
---|---|
Résumé de conversation | 1 |
Détection de la langue | 1 000 |
Analyse des sentiments | 10 |
Exploration des opinions | 10 |
Extraction d’expressions clés | 10 |
Reconnaissance d’entité nommée (NER) | 5 |
Détection des informations d’identification personnelle (PII) | 5 |
Résumé du document | 25 |
Liaison d’entités | 5 |
Analyse de texte pour la santé | 25 pour l’API web, 1 000 pour le conteneur. (125 000 caractères au total) |
Limites du taux de transfert
Votre limite de débit varie en fonction de votre niveau tarifaire. Ces limites sont les mêmes pour les deux versions de l’API. Ces limites du taux de transfert ne s’appliquent pas à l’Analyse de texte pour le conteneur d’intégrité démuni de limite définie du taux d’intégrité.
Niveau | Demandes par seconde | Requêtes par minute |
---|---|---|
S / Multiservice | 1 000 | 1 000 |
S0 / F0 | 100 | 300 |
Les taux de requêtes sont mesurées séparément pour chaque fonctionnalité. Vous pouvez envoyer le nombre maximal de demandes correspondant à votre niveau tarifaire pour chaque fonctionnalité en même temps. Par exemple, si vous êtes dans le niveau S
et que vous envoyez 1 000 demandes à la fois, vous ne pouvez pas envoyer une autre demande pendant 59 secondes.