Quotas et limites du service

Article
01/19/2024

Ce contenu s’applique à :v4.0 (préversion) | Versions précédentes :v3.1 (GA)v3.0 (GA)

Ce contenu s’applique à :v2.1 | Dernière version :v4.0 (préversion)

Cet article contient à la fois une référence rapide et une description détaillée des quotas et limites du service Azure AI Intelligence documentaire pour tous les niveaux tarifaires. Il présente également les meilleures pratiques pour éviter la limitation des demandes.

Utilisation du modèle

Types de documents pris en charge	Lire	Disposition	Modèles prédéfinis	Modèles personnalisés
PDF	✔️	✔️	✔️	✔️
Images (JPEG/JPG), PNG, BMP, TIFF, HEIF	✔️	✔️	✔️	✔️
Types de fichiers Office DOCX, PPT, XLS	✔️	✖️	✖️	✖️

Types de documents pris en charge	Lire	Disposition	Modèles prédéfinis	Modèles personnalisés
PDF	✔️	✔️	✔️	✔️
Images (JPEG/JPG), PNG, BMP, TIFF, HEIF	✔️	✔️	✔️	✔️
Types de fichiers Office DOCX, PPT, XLS	✔️	✔️	✖️	✖️

Quota	Gratuit (F0)¹	Standard (S0)
Limite de transactions par seconde	1	15 (valeur par défaut)
Réglable	Non	Oui ²
Taille maximale de document	4 Mo	500 Mo
Réglable	Non	Non
Nombre maximal de pages (Analyse)	2	2000
Réglable	Non	Non
Taille maximale de fichier d’étiquettes	10 Mo	10 Mo
Réglable	Non	Non
Taille maximale de la réponse json OCR	500 Mo	500 Mo
Réglable	Non	Non
Nombre maximal de modèles	500	5 000
Réglable	Non	Non
Nombre maximal de modèles neuronaux	100	500
Réglable	Non	Non

Utilisation du modèle personnalisé

Quota	Gratuit (F0)¹	Standard (S0)
Limite du modèle compose	5	200 (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Neural**	1 Go ³	1 Go (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Modèle**	50 Mo ⁴	50 Mo (valeur par défaut)
Réglable	Non	Non
*Nombre maximal de pages (entraînement) Modèle**	500	500 (valeur par défaut)
Réglable	Non	Non
*Nombre maximal de pages (entraînement) Neural**	50 000	50 000 (valeur par défaut)
Réglable	Non	Non
Apprentissage du modèle neural personnalisé	10 par mois	20 par mois
Réglable	Non	Oui ³
*Nombre maximal de pages (entraînement) Classifieur**	10 000	10 000 (valeur par défaut)
Réglable	Non	No
*Nombre maximal de types de documents (classes) Classifieur**	500	500 (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Classifieur**	1 Go	1 Go (valeur par défaut)
Réglable	Non	No
*Nombre minimal d’échantillons par classe Classifieur**	5	5 (valeur par défaut)
Réglable	Non	Non

Limites du modèle personnalisé

Quota	Gratuit (F0)¹	Standard (S0)
Limite du modèle compose	5	200 (valeur par défaut)
Réglable	Non	Non
Taille du jeu de données d’entraînement	50 Mo	50 Mo (valeur par défaut)
Réglable	Non	Non
Nombre maximal de pages (entraînement)	500	500 (valeur par défaut)
Réglable	Non	Non

¹ Pour le niveau tarifaire Gratuit (F0), consultez également les allocations mensuelles sur la page de tarification.
² Consultez les meilleures pratiques et [instructions d’ajustement(#create-and-submit-support-request).
³ Le décompte des entraînements de modèles neuraux est réinitialisé tous les mois calendaires. Ouvrez une demande de support pour augmenter la limite d’entraînement mensuelle.

⁴ Cette limite s’applique à tous les documents trouvés dans votre dossier de jeu de données d’apprentissage avant les mises à jour liées à l’étiquetage.

Description détaillée, ajustement de quota et meilleures pratiques

Avant de demander une augmentation de quota (le cas échéant), assurez-vous qu’elle est nécessaire. Le service Intelligence documentaire utilise la mise à l’échelle automatique pour mettre les ressources de calcul requises en mode « à la demande » et limiter le coût pour les clients, ainsi que déprovisionner des ressources non utilisées en ne conservant pas une quantité excessive de capacité matérielle.

Si votre application renvoie le code de réponse 429 (trop de requêtes) et que votre charge de travail se situe dans les limites définies, il est fort probable que le service s'adapte à votre demande, mais n'a pas encore atteint l'échelle requise. Ainsi, le service ne dispose pas immédiatement de suffisamment de ressources pour répondre à la demande. Cet état est temporaire et bref.

Meilleures pratiques générales pour atténuer la limitation lors de la mise à l’échelle automatique

Pour réduire les problèmes liés à la limitation (code de réponse 429), nous vous recommandons d’utiliser les techniques suivantes :

Implémentez la logique de nouvelle tentative dans votre application.
Évitez les variations nettes de la charge de travail. Augmentez la charge de travail graduellement.
Exemple. Votre application utilise Intelligence documentaire et votre charge de travail actuelle est de 10 TPS (transactions par seconde). À la seconde suivante, vous augmentez la charge à 40 TPS (soit quatre fois plus). Le service commence immédiatement la mise à l’échelle pour répondre à la nouvelle charge. Toutefois, comme il est probable qu’il ne puisse pas le faire en une seconde, certaines requêtes reçoivent le code de réponse 429.

Les sections suivantes décrivent des cas spécifiques d’ajustement des quotas. Passer à Intelligence documentaire : augmentation de la limite de requêtes simultanées

Augmentation de la mimite de demandes de transactions par seconde

Par défaut, le nombre de transactions par seconde est limité à 15 TPS pour une ressource Intelligence documentaire. Pour le niveau tarifaire standard, vous pouvez augmenter ce nombre. Avant de soumettre la requête, assurez-vous que vous êtes familiarisé avec le contenu de cette section et que vous connaissez ces meilleures pratiques.

L’amélioration de la limite de demandes simultanées n’affecte pas directement vos coûts. Le service Intelligence documentaire utilise le modèle « Payez uniquement pour ce que vous utilisez ». La limite définit la hauteur à laquelle le service peut mettre à l’échelle avant de commencer à limiter vos demandes.

La valeur existante du paramètre Limite de demandes simultanées n’est pas visible via le portail Azure, des outils en ligne de commande ou des demandes d’API. Pour vérifier la valeur existante, créez une demande de support Azure.

Si vous souhaitez augmenter vos transactions par seconde, vous pouvez activer la mise à l’échelle automatique sur votre ressource. Suivez ce document pour activer la mise à l’échelle automatique sur votre ressource * activer la mise à l’échelle automatique. Vous pouvez également soumettre une demande de support d’augmentation de TPS.

Munissez-vous des informations requises

ID de ressource Intelligence documentaire
Région
Comment obtenir des informations (modèle de base) :
- Connectez-vous au portail Azure
- Sélectionner la ressource Intelligence documentaire pour laquelle vous souhaitez augmenter la limite de transactions
- Sélectionnez Propriétés (groupe Gestion des ressources).
- Copiez et enregistrez les valeurs des champs suivants :
  - ID de ressource
  - Emplacement (région de votre point de terminaison)

Créer et soumettre une demande de support

Initiez l’augmentation de la limite de transactions par seconde (TPS) pour votre ressource en envoyant la demande de support :

Vérifiez que vous disposez des informations requises.
Connectez-vous au portail Azure
Sélectionner la ressource Intelligence documentaire pour laquelle vous souhaitez augmenter la limite de TPS
Sélectionnez Nouvelle demande de support (groupe Support et dépannage)
Une nouvelle fenêtre s’affiche, avec des informations renseignées automatiquement sur votre abonnement Azure et la ressource Azure
Entrer un Résumé (comme « Augmenter la limite de TPS Intelligence documentaire »)
Dans Type de problème,* sélectionnez « Validation du quota ou de l’utilisation »
Sélectionnez Suivant : Solutions
Poursuivre avec la création de la demande.
Dans l’onglet Détails, entrez les informations suivantes dans le champ Description :
- notez que la requête concerne le quota Intelligence documentaire.
- Fournir une prévision TPS pour laquelle vous souhaitez effectuer une mise à l’échelle.
- Informations sur la ressource Azure que vous avez collectées.
- Remplissez les informations obligatoires et sélectionnez le bouton Créer dans l’onglet Vérifier + créer
- notez le numéro de demande de support dans les notifications du portail Azure. Vous êtes contacté dans de brefs délais pour la suite du processus

Exemple de meilleure pratique pour un modèle de charge de travail

Cet exemple présente l’approche que nous recommandons de suivre pour atténuer la limitation possible des demandes en raison d’une mise à l’échelle automatique en cours. Il ne s’agit pas d’une recette exacte, mais d’un modèle que nous invitons à suivre et à ajuster en fonction des besoins.

Supposons qu’une limite par défaut est définie pour la ressource Intelligence documentaire. Démarrez la charge de travail pour soumettre vos demandes d’analyse. Si vous constatez des limitations fréquentes avec le code de réponse 429, commencez par implémenter un backoff exponentiel sur la demande de réponse d’analyse GET. En utilisant un temps d’attente progressivement plus long entre les nouvelles tentatives pour les réponses d’erreur consécutives, par exemple un schéma 2-5-13-34 de retards entre les demandes. En général, nous vous recommandons de ne pas appeler la réponse d’analyse GET plus d’une fois toutes les 2 secondes pour une requête POST correspondante.

Si vous constatez que vous êtes limité sur le nombre de demandes POST pour les documents en cours d’envoi, envisagez d’ajouter un délai entre les demandes. Si votre charge de travail nécessite un niveau de traitement simultané plus élevé, vous devez créer une demande de support pour augmenter vos limites de service sur le nombre de transactions par seconde.

En règle générale, il est recommandé de tester la charge de travail et les modèles de charge de travail avant de passer en production.

Étapes suivantes

En savoir plus sur les codes d’erreur et la résolution des problèmes