Partager via


Quotas et limites du service

Ce contenu s’applique à :coche v4.0 (préversion) | Versions précédentes :coche-bleue v3.1 (GA) coche-bleue v3.0 (GA)

Ce contenu s’applique à : coche v2.1 | Dernière version : coche-bleue v4.0 (préversion)

Cet article contient à la fois une référence rapide et une description détaillée des quotas et limites du service Azure AI Intelligence documentaire pour tous les niveaux tarifaires. Il présente également les meilleures pratiques pour éviter la limitation des demandes.

Utilisation du modèle

Types de documents pris en charge Lire Disposition Modèles prédéfinis Modèles personnalisés Fonctionnalités du module complémentaire
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Images : JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office : DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = pris en charge ✖️ = Non pris en charge

Types de documents pris en charge Lire Disposition Modèles prédéfinis Modèles personnalisés
PDF ✔️ ✔️ ✔️ ✔️
Images : JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office : DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️

✔️ = pris en charge ✖️ = Non pris en charge

Billing

La facturation d’Intelligence documentaire est calculée mensuellement selon le type de modèle et le nombre de pages analysées. Vous trouverez les métriques d’utilisation dans le tableau de bord des métriques dans le Portail Azure. Le tableau de bord affiche le nombre de pages qu’Azure AI Intelligence documentaire traite. Vous pouvez obtenir une estimation des coûts de la ressource à l’aide de la Calculatrice de prix Azure. Pour obtenir des instructions détaillées, consultez Vérifier l’utilisation et estimer les coûts. Voici quelques détails :

  • Lorsque vous envoyez un document à des fins d’analyse, le service analyse toutes les pages, sauf si vous spécifiez une plage de pages à l’aide du paramètre pages dans votre demande. Lorsque le service analyse les documents Microsoft Excel et PowerPoint par le biais du modèle de lecture, d’OCR ou de disposition, il compte chaque feuille de calcul Excel et chaque diapositive PowerPoint comme une page.

  • Lorsque le service analyse les fichiers PDF et TIFF, il compte chaque page du fichier PDF ou chaque image du fichier TIFF comme une page sans limites de caractères maximales.

  • Lorsque le service analyse les fichiers Microsoft Word et HTML pris en charge par les modèles de lecture et de disposition, il compte les pages en blocs de 3 000 caractères chacun. Par exemple, si votre document contient 7 000 caractères, trois pages sont comptées : deux pages de 3 000 caractères chacune plus une page de 1 000 caractères.

  • Les modèles Lecture et Disposition ne prennent pas en charge l’analyse des images incorporées ou liées dans les fichiers Microsoft Word, Excel, PowerPoint et HTML. Par conséquent, le service ne les compte pas comme images ajoutées.

  • L’apprentissage d’un modèle personnalisé est toujours gratuit avec Intelligence documentaire. Des frais vous sont facturés uniquement lorsque le service utilise un modèle pour analyser un document.

  • La tarification des conteneurs est identique à celle du service cloud.

  • Intelligence documentaire offre un niveau de tarification gratuit (F0) qui vous permet de tester toutes ses fonctionnalités.

  • Intelligence documentaire propose un modèle de tarification sur engagement pour les charges de travail volumineuses.

  • Le modèle de disposition est requis afin de générer des étiquettes pour votre jeu de données dans le cadre d’un entraînement personnalisé. Si le jeu de données que vous utilisez pour l’entraînement personnalisé ne dispose pas de fichiers d’étiquettes, le service les génère pour vous et vous facture l’utilisation du modèle de disposition.

Quota Gratuit (F0)1 Standard (S0)
Limite de transactions par seconde 1 15 (valeur par défaut)
Réglable Non Oui 2
Taille maximale de document 4 Mo 500 Mo
Réglable Non Non
Nombre maximal de pages (Analyse) 2 2000
Réglable Non Non
Taille maximale de fichier d’étiquettes 10 Mo 10 Mo
Réglable Non Non
Taille maximale de la réponse json OCR 500 Mo 500 Mo
Réglable Non Non
Nombre maximal de modèles 500 5 000
Réglable Non Non
Nombre maximal de modèles neuronaux 100 500
Réglable Non Non

Utilisation du modèle personnalisé

Quota Gratuit (F0)1 Standard (S0)
Limite du modèle compose 5 500 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Neural et génératif 1 Go 3 1 Go (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Modèle 50 Mo 4 50 Mo (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Modèle 500 500 (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Neural et génératif 50 000 50 000 (valeur par défaut)
Réglable Non Non
Apprentissage du modèle neural personnalisé 10 heures par mois 5 aucune limite (paiement par heure)
Réglable Non Oui 3
Nombre maximal de pages (entraînement) * Classifieur 10 000 10 000 (valeur par défaut)
Réglable Non No
Nombre maximal de types de documents (classes) * Classifieur 500 500 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Classifieur 1 Go 2 Go (valeur par défaut)
Réglable Non No
Nombre minimal d’échantillons par classe * Classifieur 5 5 (valeur par défaut)
Réglable Non Non

Utilisation du modèle personnalisé

Quota Gratuit (F0)1 Standard (S0)
Limite du modèle compose 5 200 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Neural 1 Go 3 1 Go (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Modèle 50 Mo 4 50 Mo (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Modèle 500 500 (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Neural 50 000 50 000 (valeur par défaut)
Réglable Non Non
Apprentissage du modèle neural personnalisé 10 par mois 20 par mois
Réglable Non Oui 3
Nombre maximal de pages (entraînement) * Classifieur 10 000 10 000 (valeur par défaut)
Réglable Non No
Nombre maximal de types de documents (classes) * Classifieur 500 500 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Classifieur 1 Go 1 Go (valeur par défaut)
Réglable Non No
Nombre minimal d’échantillons par classe * Classifieur 5 5 (valeur par défaut)
Réglable Non Non

Utilisation du modèle personnalisé

Quota Gratuit (F0)1 Standard (S0)
Limite du modèle compose 5 200 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Neural 1 Go 3 1 Go (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Modèle 50 Mo 4 50 Mo (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Modèle 500 500 (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) * Neural 50 000 50 000 (valeur par défaut)
Réglable Non Non
Apprentissage du modèle neural personnalisé 10 par mois 20 par mois
Réglable Non Oui 3
Nombre maximal de pages (entraînement) * Classifieur 10 000 10 000 (valeur par défaut)
Réglable Non No
Nombre maximal de types de documents (classes) * Classifieur 500 500 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement * Classifieur 1 Go 1 Go (valeur par défaut)
Réglable Non No
Nombre minimal d’échantillons par classe * Classifieur 5 5 (valeur par défaut)
Réglable Non Non

Limites du modèle personnalisé

Quota Gratuit (F0)1 Standard (S0)
Limite du modèle compose 5 200 (valeur par défaut)
Réglable Non Non
Taille du jeu de données d’entraînement 50 Mo 50 Mo (valeur par défaut)
Réglable Non Non
Nombre maximal de pages (entraînement) 500 500 (valeur par défaut)
Réglable Non Non

1 Pour le niveau tarifaire Gratuit (F0), consultez également les limites mensuelles sur la page de tarification.
2 Consultez les bonnes pratiques et les instructions d’ajustement.
3 Le décompte des entraînements de modèles neuraux est réinitialisé tous les premiers du mois. Ouvrez une demande de support pour augmenter la limite d’entraînement mensuelle.

4 Cette limite s’applique à tous les documents trouvés dans votre dossier de jeu de données d’apprentissage avant les mises à jour liées à l’étiquetage.

5 Cette limite s’applique uniquement aux modèles neuraux personnalisés v 4.0 (2024-07-31). À partir de v 4.0, nous prenons en charge l’entraînement avec des documents plus volumineux sur des durées plus longues (jusqu’à 10 heures gratuitement, et moyennant des frais par la suite). Pour plus d’informations, reportez-vous à la page de modèle neural personnalisé.

Description détaillée, ajustement de quota et meilleures pratiques

Avant de demander une augmentation de quota (le cas échéant), assurez-vous qu’elle est nécessaire. Le service Intelligence documentaire utilise la mise à l’échelle automatique pour mettre les ressources de calcul requises on-demand, limiter le coût pour les clients, ainsi que déprovisionner des ressources non utilisées en ne conservant pas une quantité excessive de capacité matérielle.

Si votre application renvoie le code de réponse 429 (trop de requêtes) et que votre charge de travail se situe dans les limites définies, il est fort probable que le service s'adapte à votre demande, mais n'a pas encore atteint l'échelle requise. Ainsi, le service ne dispose pas immédiatement de suffisamment de ressources pour répondre à la demande. Cet état est temporaire et bref.

Meilleures pratiques générales pour atténuer la limitation lors de la mise à l’échelle automatique

Pour réduire les problèmes liés à la limitation (code de réponse 429), nous vous recommandons d’utiliser les techniques suivantes :

  • Implémentez la logique de nouvelle tentative dans votre application.
  • Évitez les variations nettes de la charge de travail. Augmentez la charge de travail graduellement.
    Exemple. Votre application utilise Intelligence documentaire et votre charge de travail actuelle est de 10 TPS (transactions par seconde). À la seconde suivante, vous augmentez la charge à 40 TPS (soit quatre fois plus). Le service commence immédiatement la mise à l’échelle pour répondre à la nouvelle charge. Toutefois, comme il est probable qu’il ne puisse pas le faire en une seconde, certaines requêtes reçoivent le code de réponse 429.

Les sections suivantes décrivent des cas spécifiques d’ajustement des quotas. Passer à Intelligence documentaire : augmentation de la limite de requêtes simultanées

Augmentation de la mimite de demandes de transactions par seconde

Par défaut, le nombre de transactions par seconde est limité à 15 TPS pour une ressource Intelligence documentaire. Pour le niveau tarifaire standard, vous pouvez augmenter ce nombre. Avant de soumettre la requête, assurez-vous que vous êtes familiarisé avec le contenu de cette section et que vous connaissez ces meilleures pratiques.

L’amélioration de la limite de demandes simultanées n’affecte pas directement vos coûts. Le service Intelligence documentaire utilise le modèle « Payez uniquement pour ce que vous utilisez ». La limite définit la hauteur à laquelle le service peut mettre à l’échelle avant de commencer à limiter vos demandes.

La valeur existante du paramètre Limite de demandes simultanées n’est pas visible via le portail Azure, des outils en ligne de commande ou des demandes d’API. Pour vérifier la valeur existante, créez une demande de support Azure.

Si vous souhaitez augmenter vos transactions par seconde, vous pouvez activer la mise à l’échelle automatique sur votre ressource. Suivez ce document pour activer la mise à l’échelle automatique sur votre ressource * activer la mise à l’échelle automatique. Vous pouvez également soumettre une demande de support d’augmentation de TPS.

Munissez-vous des informations requises

  • ID de ressource Intelligence documentaire

  • Région

  • Informations sur le modèle de base :

    • Connectez-vous au portail Azure
    • Sélectionner la ressource Intelligence documentaire pour laquelle vous souhaitez augmenter la limite de transactions
    • Sélectionnez Propriétés (groupe Gestion des ressources).
    • Copiez et enregistrez les valeurs des champs suivants :
      • ID de ressource
      • Emplacement (région de votre point de terminaison)

Créer et soumettre une demande de support

Initiez l’augmentation de la limite de transactions par seconde (TPS) pour votre ressource en envoyant la demande de support :

  • Vérifiez que vous disposez des informations requises.
  • Connectez-vous au portail Azure
  • Sélectionner la ressource Intelligence documentaire pour laquelle vous souhaitez augmenter la limite de TPS
  • Sélectionnez Nouvelle demande de support (groupe Support + résolution des problèmes). Une nouvelle fenêtre s’affiche, avec des informations renseignées automatiquement sur votre abonnement Azure et la ressource Azure
  • Entrez un Résumé (par exemple, « Augmenter la limite de TPS Intelligence documentaire »).
  • Pour le champ Type de problème, sélectionnez Validation du quota ou de l’utilisation.
  • Sélectionnez Suivant : Solutions.
  • Poursuivre avec la création de la demande.
  • Sous l’onglet Détails, entrez les informations suivantes dans le champ Description :
    • notez que la requête concerne le quota Intelligence documentaire.
    • Fournir une prévision TPS pour laquelle vous souhaitez effectuer une mise à l’échelle.
    • Informations sur la ressource Azure que vous avez collectées.
    • Entrez le reste des informations requises et sélectionnez le bouton Créer sous l’onglet Vérifier + créer.
    • notez le numéro de demande de support dans les notifications du portail Azure. Le support vous contactera sous peu pour la suite du traitement.

Exemple de meilleure pratique pour un modèle de charge de travail

Cet exemple présente l’approche que nous recommandons de suivre pour atténuer la limitation possible des demandes en raison d’une mise à l’échelle automatique en cours. Il ne s’agit pas d’une recette exacte, mais d’un modèle que nous invitons à suivre et à ajuster en fonction des besoins.

Supposons qu’une limite par défaut est définie pour la ressource Intelligence documentaire. Démarrez la charge de travail pour soumettre vos demandes d’analyse. Si vous constatez des limitations fréquentes avec le code de réponse 429, commencez par implémenter un backoff exponentiel sur la demande de réponse d’analyse GET. En utilisant un temps d’attente progressivement plus long entre les nouvelles tentatives pour les réponses d’erreur consécutives, par exemple un schéma 2-5-13-34 de retards entre les demandes. En général, nous vous recommandons de ne pas appeler la réponse d’analyse GET plus d’une fois toutes les 2 secondes pour une requête POST correspondante.

Si vous constatez que vous êtes limité sur le nombre de demandes POST pour les documents en cours d’envoi, envisagez d’ajouter un délai entre les demandes. Si votre charge de travail nécessite un niveau de traitement simultané plus élevé, vous devez créer une demande de support pour augmenter vos limites de service sur le nombre de transactions par seconde.

En règle générale, il est recommandé de tester la charge de travail et les modèles de charge de travail avant de passer en production.

Étapes suivantes