Quotas et limites du service

Article
09/03/2024

Ce contenu s’applique à : v4.0 (préversion) | Versions précédentes : v3.1 (GA) v3.0 (GA)

Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (préversion)

Cet article contient à la fois une référence rapide et une description détaillée des quotas et limites du service Azure AI Intelligence documentaire pour tous les niveaux tarifaires. Il présente également les meilleures pratiques pour éviter la limitation des demandes.

Utilisation du modèle

Types de documents pris en charge	Lire	Disposition	Modèles prédéfinis	Modèles personnalisés	Fonctionnalités du module complémentaire
PDF	✔️	✔️	✔️	✔️	✔️
Images : `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office : `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = pris en charge ✖️ = Non pris en charge

Types de documents pris en charge	Lire	Disposition	Modèles prédéfinis	Modèles personnalisés
PDF	✔️	✔️	✔️	✔️
Images : `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office : `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = pris en charge ✖️ = Non pris en charge

Billing

La facturation d’Intelligence documentaire est calculée mensuellement selon le type de modèle et le nombre de pages analysées. Vous trouverez les métriques d’utilisation dans le tableau de bord des métriques dans le Portail Azure. Le tableau de bord affiche le nombre de pages qu’Azure AI Intelligence documentaire traite. Vous pouvez obtenir une estimation des coûts de la ressource à l’aide de la Calculatrice de prix Azure. Pour obtenir des instructions détaillées, consultez Vérifier l’utilisation et estimer les coûts. Voici quelques détails :

Lorsque vous envoyez un document à des fins d’analyse, le service analyse toutes les pages, sauf si vous spécifiez une plage de pages à l’aide du paramètre pages dans votre demande. Lorsque le service analyse les documents Microsoft Excel et PowerPoint par le biais du modèle de lecture, d’OCR ou de disposition, il compte chaque feuille de calcul Excel et chaque diapositive PowerPoint comme une page.
Lorsque le service analyse les fichiers PDF et TIFF, il compte chaque page du fichier PDF ou chaque image du fichier TIFF comme une page sans limites de caractères maximales.
Lorsque le service analyse les fichiers Microsoft Word et HTML pris en charge par les modèles de lecture et de disposition, il compte les pages en blocs de 3 000 caractères chacun. Par exemple, si votre document contient 7 000 caractères, trois pages sont comptées : deux pages de 3 000 caractères chacune plus une page de 1 000 caractères.
Les modèles Lecture et Disposition ne prennent pas en charge l’analyse des images incorporées ou liées dans les fichiers Microsoft Word, Excel, PowerPoint et HTML. Par conséquent, le service ne les compte pas comme images ajoutées.
L’apprentissage d’un modèle personnalisé est toujours gratuit avec Intelligence documentaire. Des frais vous sont facturés uniquement lorsque le service utilise un modèle pour analyser un document.
La tarification des conteneurs est identique à celle du service cloud.
Intelligence documentaire offre un niveau de tarification gratuit (F0) qui vous permet de tester toutes ses fonctionnalités.
Intelligence documentaire propose un modèle de tarification sur engagement pour les charges de travail volumineuses.
Le modèle de disposition est requis afin de générer des étiquettes pour votre jeu de données dans le cadre d’un entraînement personnalisé. Si le jeu de données que vous utilisez pour l’entraînement personnalisé ne dispose pas de fichiers d’étiquettes, le service les génère pour vous et vous facture l’utilisation du modèle de disposition.

Quota	Gratuit (F0)¹	Standard (S0)
Limite de transactions par seconde	1	15 (valeur par défaut)
Réglable	Non	Oui ²
Taille maximale de document	4 Mo	500 Mo
Réglable	Non	Non
Nombre maximal de pages (Analyse)	2	2000
Réglable	Non	Non
Taille maximale de fichier d’étiquettes	10 Mo	10 Mo
Réglable	Non	Non
Taille maximale de la réponse json OCR	500 Mo	500 Mo
Réglable	Non	Non
Nombre maximal de modèles	500	5 000
Réglable	Non	Non
Nombre maximal de modèles neuronaux	100	500
Réglable	Non	Non

Utilisation du modèle personnalisé

Quota	Gratuit (F0)¹	Standard (S0)
Limite du modèle compose	5	500 (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Neural et génératif**	1 Go ³	1 Go (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Modèle**	50 Mo ⁴	50 Mo (valeur par défaut)
Réglable	Non	Non
*Nombre maximal de pages (entraînement) Modèle**	500	500 (valeur par défaut)
Réglable	Non	Non
*Nombre maximal de pages (entraînement) Neural et génératif**	50 000	50 000 (valeur par défaut)
Réglable	Non	Non
Apprentissage du modèle neural personnalisé	10 heures par mois ⁵	aucune limite (paiement par heure)
Réglable	Non	Oui ³
*Nombre maximal de pages (entraînement) Classifieur**	10 000	10 000 (valeur par défaut)
Réglable	Non	No
*Nombre maximal de types de documents (classes) Classifieur**	500	500 (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Classifieur**	1 Go	2 Go (valeur par défaut)
Réglable	Non	No
*Nombre minimal d’échantillons par classe Classifieur**	5	5 (valeur par défaut)
Réglable	Non	Non

Utilisation du modèle personnalisé

Quota	Gratuit (F0)¹	Standard (S0)
Limite du modèle compose	5	200 (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Neural**	1 Go ³	1 Go (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Modèle**	50 Mo ⁴	50 Mo (valeur par défaut)
Réglable	Non	Non
*Nombre maximal de pages (entraînement) Modèle**	500	500 (valeur par défaut)
Réglable	Non	Non
*Nombre maximal de pages (entraînement) Neural**	50 000	50 000 (valeur par défaut)
Réglable	Non	Non
Apprentissage du modèle neural personnalisé	10 par mois	20 par mois
Réglable	Non	Oui ³
*Nombre maximal de pages (entraînement) Classifieur**	10 000	10 000 (valeur par défaut)
Réglable	Non	No
*Nombre maximal de types de documents (classes) Classifieur**	500	500 (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Classifieur**	1 Go	1 Go (valeur par défaut)
Réglable	Non	No
*Nombre minimal d’échantillons par classe Classifieur**	5	5 (valeur par défaut)
Réglable	Non	Non

Utilisation du modèle personnalisé

Quota	Gratuit (F0)¹	Standard (S0)
Limite du modèle compose	5	200 (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Neural**	1 Go ³	1 Go (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Modèle**	50 Mo ⁴	50 Mo (valeur par défaut)
Réglable	Non	Non
*Nombre maximal de pages (entraînement) Modèle**	500	500 (valeur par défaut)
Réglable	Non	Non
*Nombre maximal de pages (entraînement) Neural**	50 000	50 000 (valeur par défaut)
Réglable	Non	Non
Apprentissage du modèle neural personnalisé	10 par mois	20 par mois
Réglable	Non	Oui ³
*Nombre maximal de pages (entraînement) Classifieur**	10 000	10 000 (valeur par défaut)
Réglable	Non	No
*Nombre maximal de types de documents (classes) Classifieur**	500	500 (valeur par défaut)
Réglable	Non	Non
*Taille du jeu de données d’entraînement Classifieur**	1 Go	1 Go (valeur par défaut)
Réglable	Non	No
*Nombre minimal d’échantillons par classe Classifieur**	5	5 (valeur par défaut)
Réglable	Non	Non

Limites du modèle personnalisé

Quota	Gratuit (F0)¹	Standard (S0)
Limite du modèle compose	5	200 (valeur par défaut)
Réglable	Non	Non
Taille du jeu de données d’entraînement	50 Mo	50 Mo (valeur par défaut)
Réglable	Non	Non
Nombre maximal de pages (entraînement)	500	500 (valeur par défaut)
Réglable	Non	Non

¹ Pour le niveau tarifaire Gratuit (F0), consultez également les limites mensuelles sur la page de tarification.
² Consultez les bonnes pratiques et les instructions d’ajustement.
³ Le décompte des entraînements de modèles neuraux est réinitialisé tous les premiers du mois. Ouvrez une demande de support pour augmenter la limite d’entraînement mensuelle.

⁴ Cette limite s’applique à tous les documents trouvés dans votre dossier de jeu de données d’apprentissage avant les mises à jour liées à l’étiquetage.

⁵ Cette limite s’applique uniquement aux modèles neuraux personnalisés v 4.0 (2024-07-31). À partir de v 4.0, nous prenons en charge l’entraînement avec des documents plus volumineux sur des durées plus longues (jusqu’à 10 heures gratuitement, et moyennant des frais par la suite). Pour plus d’informations, reportez-vous à la page de modèle neural personnalisé.

Description détaillée, ajustement de quota et meilleures pratiques

Avant de demander une augmentation de quota (le cas échéant), assurez-vous qu’elle est nécessaire. Le service Intelligence documentaire utilise la mise à l’échelle automatique pour mettre les ressources de calcul requises on-demand, limiter le coût pour les clients, ainsi que déprovisionner des ressources non utilisées en ne conservant pas une quantité excessive de capacité matérielle.

Si votre application renvoie le code de réponse 429 (trop de requêtes) et que votre charge de travail se situe dans les limites définies, il est fort probable que le service s'adapte à votre demande, mais n'a pas encore atteint l'échelle requise. Ainsi, le service ne dispose pas immédiatement de suffisamment de ressources pour répondre à la demande. Cet état est temporaire et bref.

Meilleures pratiques générales pour atténuer la limitation lors de la mise à l’échelle automatique

Pour réduire les problèmes liés à la limitation (code de réponse 429), nous vous recommandons d’utiliser les techniques suivantes :

Implémentez la logique de nouvelle tentative dans votre application.
Évitez les variations nettes de la charge de travail. Augmentez la charge de travail graduellement.
Exemple. Votre application utilise Intelligence documentaire et votre charge de travail actuelle est de 10 TPS (transactions par seconde). À la seconde suivante, vous augmentez la charge à 40 TPS (soit quatre fois plus). Le service commence immédiatement la mise à l’échelle pour répondre à la nouvelle charge. Toutefois, comme il est probable qu’il ne puisse pas le faire en une seconde, certaines requêtes reçoivent le code de réponse 429.

Les sections suivantes décrivent des cas spécifiques d’ajustement des quotas. Passer à Intelligence documentaire : augmentation de la limite de requêtes simultanées

Augmentation de la mimite de demandes de transactions par seconde

Par défaut, le nombre de transactions par seconde est limité à 15 TPS pour une ressource Intelligence documentaire. Pour le niveau tarifaire standard, vous pouvez augmenter ce nombre. Avant de soumettre la requête, assurez-vous que vous êtes familiarisé avec le contenu de cette section et que vous connaissez ces meilleures pratiques.

L’amélioration de la limite de demandes simultanées n’affecte pas directement vos coûts. Le service Intelligence documentaire utilise le modèle « Payez uniquement pour ce que vous utilisez ». La limite définit la hauteur à laquelle le service peut mettre à l’échelle avant de commencer à limiter vos demandes.

La valeur existante du paramètre Limite de demandes simultanées n’est pas visible via le portail Azure, des outils en ligne de commande ou des demandes d’API. Pour vérifier la valeur existante, créez une demande de support Azure.

Si vous souhaitez augmenter vos transactions par seconde, vous pouvez activer la mise à l’échelle automatique sur votre ressource. Suivez ce document pour activer la mise à l’échelle automatique sur votre ressource * activer la mise à l’échelle automatique. Vous pouvez également soumettre une demande de support d’augmentation de TPS.

Munissez-vous des informations requises

ID de ressource Intelligence documentaire
Région
Informations sur le modèle de base :
- Connectez-vous au portail Azure
- Sélectionner la ressource Intelligence documentaire pour laquelle vous souhaitez augmenter la limite de transactions
- Sélectionnez Propriétés (groupe Gestion des ressources).
- Copiez et enregistrez les valeurs des champs suivants :
  - ID de ressource
  - Emplacement (région de votre point de terminaison)

Créer et soumettre une demande de support

Initiez l’augmentation de la limite de transactions par seconde (TPS) pour votre ressource en envoyant la demande de support :

Vérifiez que vous disposez des informations requises.
Connectez-vous au portail Azure
Sélectionner la ressource Intelligence documentaire pour laquelle vous souhaitez augmenter la limite de TPS
Sélectionnez Nouvelle demande de support (groupe Support + résolution des problèmes). Une nouvelle fenêtre s’affiche, avec des informations renseignées automatiquement sur votre abonnement Azure et la ressource Azure
Entrez un Résumé (par exemple, « Augmenter la limite de TPS Intelligence documentaire »).
Pour le champ Type de problème, sélectionnez Validation du quota ou de l’utilisation.
Sélectionnez Suivant : Solutions.
Poursuivre avec la création de la demande.
Sous l’onglet Détails, entrez les informations suivantes dans le champ Description :
- notez que la requête concerne le quota Intelligence documentaire.
- Fournir une prévision TPS pour laquelle vous souhaitez effectuer une mise à l’échelle.
- Informations sur la ressource Azure que vous avez collectées.
- Entrez le reste des informations requises et sélectionnez le bouton Créer sous l’onglet Vérifier + créer.
- notez le numéro de demande de support dans les notifications du portail Azure. Le support vous contactera sous peu pour la suite du traitement.

Exemple de meilleure pratique pour un modèle de charge de travail

Cet exemple présente l’approche que nous recommandons de suivre pour atténuer la limitation possible des demandes en raison d’une mise à l’échelle automatique en cours. Il ne s’agit pas d’une recette exacte, mais d’un modèle que nous invitons à suivre et à ajuster en fonction des besoins.

Supposons qu’une limite par défaut est définie pour la ressource Intelligence documentaire. Démarrez la charge de travail pour soumettre vos demandes d’analyse. Si vous constatez des limitations fréquentes avec le code de réponse 429, commencez par implémenter un backoff exponentiel sur la demande de réponse d’analyse GET. En utilisant un temps d’attente progressivement plus long entre les nouvelles tentatives pour les réponses d’erreur consécutives, par exemple un schéma 2-5-13-34 de retards entre les demandes. En général, nous vous recommandons de ne pas appeler la réponse d’analyse GET plus d’une fois toutes les 2 secondes pour une requête POST correspondante.

Si vous constatez que vous êtes limité sur le nombre de demandes POST pour les documents en cours d’envoi, envisagez d’ajouter un délai entre les demandes. Si votre charge de travail nécessite un niveau de traitement simultané plus élevé, vous devez créer une demande de support pour augmenter vos limites de service sur le nombre de transactions par seconde.

En règle générale, il est recommandé de tester la charge de travail et les modèles de charge de travail avant de passer en production.

Étapes suivantes

En savoir plus sur les codes d’erreur et la résolution des problèmes

Partager via

Quotas et limites du service

Utilisation du modèle

Billing

Utilisation du modèle personnalisé

Utilisation du modèle personnalisé

Utilisation du modèle personnalisé

Limites du modèle personnalisé

Description détaillée, ajustement de quota et meilleures pratiques

Meilleures pratiques générales pour atténuer la limitation lors de la mise à l’échelle automatique

Augmentation de la mimite de demandes de transactions par seconde

Munissez-vous des informations requises

Créer et soumettre une demande de support

Exemple de meilleure pratique pour un modèle de charge de travail

Étapes suivantes

Commentaires

Ressources supplémentaires