Édition

FAQ sur Azure AI Intelligence documentaire

Ce contenu s’applique à :cochev4.0 (préversion)cochev3.1 (GA)cochev3.0 (GA)cochev2.1 (GA)

Concepts généraux

Qu’est-ce qu’Azure AI Intelligence documentaire et qu’est-il arrivé à Azure AI Form Recognizer ?

Azure AI Intelligence documentaire est un service basé sur le cloud qui utilise des modèles de Machine Learning pour extraire des paires clé-valeur, du texte et des tableaux de vos documents. Le résultat retourné est une sortie JSON structurée. Intelligence documentaire répond à plusieurs cas d’usage, notamment au traitement de données automatisé, aux stratégies améliorées pilotées par les données et aux capacités enrichies de recherche dans les documents.

Intelligence documentaire fait partie d’Azure AI services. Azure AI services englobe tous les services précédemment appelés Azure Cognitive Services et Azure Applied AI Services.

Le nom précédent d’Intelligence documentaire était Azure AI Form Recognizer. Form Recognizer est officiellement devenu Intelligence documentaire en juillet 2023.

Il n’y a aucune modification de la tarification. Les noms Cognitive Services et Applied AI Services continuent d’être utilisés dans la facturation Azure, l’analyse des coûts, la liste de prix et les API de tarification.

Il n’existe aucun changement cassant des API ou des bibliothèques clientes (SDK). Les API REST et les versions 2024-02-29-preview, 2023-10-31-preview et ultérieures du kit de développement logiciel (SDK) sont renommées document intelligence.

Certaines plateformes attendent toujours la mise à jour du changement de nom. Dans la documentation Microsoft, toutes les mentions de Form Recognizer et Intelligence documentaire font référence au même service Azure.

Comment le service Intelligence documentaire est-il lié à l’IA générative de documents ?

Vous pouvez utiliser une solution d’IA générative de documents pour discuter avec vos documents, générer du contenu captivant à partir de ces derniers et accéder à la puissance des modèles Azure OpenAI Service sur vos données. Grâce à la combinaison d’Azure AI Intelligence documentaire et d’Azure OpenAI, vous pouvez créer une application d’entreprise pour interagir en toute transparence avec vos documents à l’aide de langages naturels, trouver facilement des réponses et obtenir des informations précieuses, ainsi que générer du contenu nouveau et attrayant à partir de vos documents existants. Plus d’informations sont disponibles sur le blog de la communauté technique.

Quel est le lien entre Intelligence documentaire et la génération augmentée de récupération ?

La segmentation sémantique est une étape clé de la génération augmentée de récupération (RAG) pour garantir un stockage et une récupération efficaces. Le modèle de disposition Intelligence documentaire offre une solution complète pour des fonctionnalités avancées d’extraction de contenu et d’analyse de la structure des documents.

Le modèle de disposition permet d’extraire facilement le texte et les éléments structurels de documents, divisant ainsi de grands corps de texte en blocs explicites plus petits en fonction de leur contenu sémantique et non de fractionnements arbitraires. Vous pouvez ensuite générer facilement les informations extraites au format Markdown, ce qui vous permet de définir votre stratégie de segmentation sémantique selon les modèles fournis. Pour plus d’informations, consultez la Vue d’ensemble de la RAG dans Intelligence documentaire.

Quels sont les cas d’utilisation d’Intelligence documentaire qui nécessitent une attention particulière ?

Accordez une attention particulière aux projets de traitement de documents qui englobent des données financières, des informations médicales protégées, des données à caractère personnel ou des données hautement sensibles.

Veillez à respecter toutes les exigences nationales, régionales et sectorielles.

Quelles sont les langues prises en charge par Intelligence documentaire ?

Les modèles universels basés sur le Deep Learning dans Intelligence documentaire prennent en charge de nombreuses langues pour extraire du texte multilingue de vos images et documents, y compris des lignes de texte mêlant plusieurs langues.

La prise en charge des langues varie selon les fonctionnalités du service Intelligence documentaire. Pour connaître la liste complète des textes manuscrits et imprimés pris en charge par Intelligence documentaire, consultez Prise en charge des langues.

Le service Intelligence documentaire est-il disponible dans ma région Azure ?

Intelligence documentaire est en disponibilité générale dans un grand nombre des plus de 60 régions d’infrastructure globale Azure.

Choisissez la région qui vous convient le mieux, ainsi qu’à vos clients.

Le service Intelligence documentaire s’intègre-t-il à d’autres services Microsoft ?

Oui, Intelligence documentaire s’intègre aux services suivants :

Comment Intelligence documentaire est lié à la reconnaissance optique de caractères ?

Intelligence documentaire est un service informatique qui intègre la reconnaissance optique de caractères (OCR, Optical Character Recognition), l’analyse de texte et la classification de texte personnalisé d’Azure AI services.

Intelligence documentaire utilise l’OCR pour détecter et extraire des informations des documents textes tapés et manuscrits pris en charge par l’IA afin d’ajouter plus de structure et d’informations à l’extraction de texte.

Combien de temps mon modèle personnalisé est-il disponible pour l’utilisation ?

Un modèle a le même cycle de vie que la version de l’API que vous utilisez pour le former. Les modèles personnalisés formés avec une version en disponibilité générale de l’API ont le même cycle de vie que la version de l’API. Lorsque la version de l’API est déconseillée, le modèle n’est plus disponible pour l’inférence. Les modèles formés avec une préversion de l’API ont également le même cycle de vie que l’API en préversion.

Attendez-vous à une dépréciation des API en préversion dans les trois mois suivants la mise à jour d’une version d’API en préversion ou une version plus récente de l’API en disponibilité générale.

Qu’est-ce que le score de précision et comment est-il calculé ?

La sortie d’une opération de modèle personnalisé build (v3.0 et versions ultérieures) ou train (v2.1) comprend le score d’exactitude estimé. Ce score représente la capacité du modèle à prédire avec précision la valeur étiquetée sur un document visuellement similaire.

La précision est mesurée dans une plage de valeurs de pourcentage allant de 0 % (faible) à 100 % (élevée).

Pour plus d’informations, consultez Scores d’exactitude et de confiance.

Comment améliorer les scores de précision ?

La variance de la structure visuelle de vos documents peut influencer la précision d’un modèle. Voici quelques conseils :

  • Incluez toutes les variantes d’un document dans le jeu de données d’apprentissage. Les variantes comprennent notamment les différents formats (par exemple des fichiers PDF numériques et numérisés).

  • Séparez les types de documents visuellement distincts et effectuez l'apprentissage de différents modèles.

  • Vérifiez que vous n’avez pas d’étiquettes superflues.

  • Dans le cas des étiquettes de signature et de région, n’incluez pas le texte environnant.

Pour plus d’informations, consultez Scores d’exactitude et de confiance.

Qu’est-ce que le score de confiance et comment est-il calculé ?

Un score de confiance indique la probabilité, en mesurant le degré de certitude statistique, que le résultat extrait soit détecté correctement.

La plage de valeurs de confiance est un pourcentage allant de 0 % (faible) à 100 % (élevée). Il est préférable de viser un score d’au moins 80 %. Pour les cas plus sensibles, comme les dossiers financiers et médicaux, un score proche de 100 % est recommandé. Vous pouvez aussi exiger une évaluation humaine.

Pour plus d’informations, consultez Scores d’exactitude et de confiance.

Comment améliorer les scores de confiance ?

Après une opération d’analyse, examinez la sortie JSON. Examinez les valeurs confidence pour chaque résultat de clé/valeur sous le nœud pageResults. Vous devez également regarder les scores de confiance dans le nœud readResults, qui correspond à l’opération de lecture de texte. La confiance des résultats de la lecture n’affecte pas la confiance des résultats de l’extraction des clés/valeurs : vous devez donc vérifier les deux. Voici quelques conseils :

  • Si le score de confiance associé à l’objet readResults est faible, améliorez la qualité de vos documents d’entrée.

  • Si le score de confiance associé à l’objet pageResults est faible, assurez-vous que les documents que vous analysez sont du même type.

  • Envisagez d’incorporer une révision humaine dans vos workflows.

  • Utilisez des formulaires ayant des valeurs différentes dans chaque champ.

  • Pour les modèles personnalisés, utilisez un plus grand ensemble de documents d’apprentissage. Si vous marquez davantage de documents, votre modèle apprend à reconnaître les champs avec une plus grande précision.

Pour plus d’informations, consultez Scores d’exactitude et de confiance.

Qu’est-ce qu’un cadre englobant ?

Un cadre englobant (polygon dans les versions 3.0 et ultérieures) est un rectangle abstrait qui entoure les éléments de texte d’un document ou d’un formulaire. Il est utilisé comme point de référence pour la détection d’objet.

Le cadre englobant spécifie la position à l’aide d’un plan de coordonnées x et y présenté dans un tableau de quatre paires numériques. Chaque paire représente un coin de la zone dans l’ordre suivant : supérieur gauche, supérieur droit, inférieur droit, inférieur gauche.

Pour une image, les coordonnées sont fournies en pixels. Pour un fichier PDF, les coordonnées sont en pouces.

Le service Intelligence documentaire peut-il m’aider à classer des documents ?

Intelligence documentaire fournit des modèles de classification personnalisés qui peuvent analyser des documents à un ou plusieurs fichiers pour déterminer si un fichier d’entrée contient l’un des types de documents d’apprentissage. Le service prend en charge les scénarios suivants :

  • Fichier unique contenant un type de document, tel qu’un formulaire de demande de prêt.

  • Fichier unique contenant plusieurs documents. Un exemple serait un package de demande de prêt contenant un formulaire de demande de prêt, une fiche de paie et un relevé bancaire.

  • Fichier unique contenant plusieurs fois le même document. Un exemple serait une collection de factures numérisées.

Pour plus d’informations, consultez Vue d’ensemble des modèles de classification personnalisés.

Développement d’application

Quelles sont les options de développement pour Document Intelligence ?

Intelligence documentaire offre les toutes dernières options de développement sur les plateformes suivantes :

Où se trouve la version de l’API prise en charge pour les derniers kits SDK du langage de programmation ?

Ce tableau fournit des liens vers les dernières versions du SDK, et montre la relation entre les versions prises en charge du SDK et de l’API Intelligence documentaire :

Informations de référence sur les langues pris en charge par le kit de développement logiciel (SDK) Azure Versions d'API prises en charge
• C#/.NET : 4.0.0

• Java : 4.0.0

• JavaScript : 4.0.0

• Python 3.2.0
31-10-2023-préversion
v3.0
v2.1
v2.0

Pour plus d’informations, consultez Clients pris en charge pour la version 4.0 et Clients pris en charge pour la version 3.1.

Quelle est la différence entre la version 3.0 et la version 2.1 d’Intelligence documentaire ? Comment migrer vers la dernière version ?

Pour une plus grande facilité d’utilisation, la version 3.0 d’Intelligence documentaire introduit une bibliothèque cliente entièrement reconçue. Vous avez besoin de la dernière version du kit de développement logiciel (SDK) est requise pour accéder aux dernières fonctionnalités de l’API Intelligence documentaire. Votre code d’application doit également être mis à jour pour utiliser les nouveaux clients.

Ce tableau fournit des liens vers des instructions détaillées pour migrer vers la dernière version d’Intelligence documentaire :

Langue/API Guide de migration
API REST v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Quels formats de fichiers sont pris en charge par Intelligence documentaire ? Existe-t-il des limitations de taille pour les documents d’entrée ?

Pour obtenir des résultats optimaux, consultez Exigences relatives aux documents d’entrée.

Comment puis-je spécifier une plage de pages à analyser dans un document ?

Le paramètre pages (pris en charge dans les versions 2.1, 3.0 et ultérieures de l’API REST) vous permet de spécifier des pages pour des documents PDF et TIFF multipages. Les entrées acceptées comprennent les plages suivantes :

  • Pages uniques. Par exemple, si vous spécifiez 1, 2, les pages 1 et 2 sont traitées.
  • Plages finies. Par exemple, si vous spécifiez 2-5, les pages 2 à 5 sont traitées.
  • Plages ouvertes. Par exemple, si vous spécifiez 5-, toutes les pages à partir de la page 5 sont traitées. Si vous spécifiez -10, les pages 1 à 10 sont traitées.

Vous pouvez associer ces paramètres, et les plages peuvent se chevaucher. Par exemple, si vous spécifiez -5, 1, 3, 5-10, les pages 1 à 10 sont traitées.

Le service accepte la demande s’il peut traiter au moins une page du document. Par exemple, l’utilisation de 5-100 sur un document de cinq pages est une entrée valide dans laquelle la page 5 est traitée.

Si vous ne fournissez pas de plage de pages, l’ensemble du document est traité.

Document Intelligence Studio et l’outil d’étiquetage d’échantillon FOTT sont disponibles. Que dois-je utiliser ?

La plupart du temps, nous vous recommandons Document Intelligence Studio, car il peut réduire le temps nécessaire à la configuration des ressources et des services de stockage Intelligence documentaire.

Envisagez d’utiliser l’outil Form OCR Testing Tool (FOTT) dans les scénarios suivants :

Limites et tarification du service

Comment Azure calcule le prix de l’utilisation d’Intelligence documentaire ?

La facturation d’Intelligence documentaire est calculée mensuellement selon le type de modèle et le nombre de pages analysées. Voici quelques détails :

  • Lorsque vous envoyez un document à des fins d’analyse, le service analyse toutes les pages, sauf si vous spécifiez une plage de pages à l’aide du paramètre pages dans votre demande. Lorsque le service analyse les documents Microsoft Excel et PowerPoint par le biais du modèle de lecture, d’OCR ou de disposition, il compte chaque feuille de calcul Excel et chaque diapositive PowerPoint comme une page.

  • Lorsque le service analyse les fichiers PDF et TIFF, il compte chaque page du fichier PDF ou chaque image du fichier TIFF comme une page sans limites de caractères maximales.

  • Lorsque le service analyse les fichiers Microsoft Word et HTML pris en charge par les modèles de lecture et de disposition, il compte les pages en blocs de 3 000 caractères chacun. Par exemple, si votre document contient 7 000 caractères, trois pages sont comptées : deux pages de 3 000 caractères chacune plus une page de 1 000 caractères.

  • Lorsque vous utilisez le modèle de lecture ou de disposition pour analyser des fichiers Microsoft Word, Excel, PowerPoint et HTML, les images incorporées ou liées ne sont pas prises en charge. Par conséquent, le service ne les compte pas comme images ajoutées.

  • L’apprentissage d’un modèle personnalisé est toujours gratuit avec Intelligence documentaire. Vous êtes facturé uniquement lorsque le service utilise un modèle pour analyser un document.

  • La tarification des conteneurs est identique à celle du service cloud.

  • Intelligence documentaire offre un niveau de tarification gratuit (F0) qui vous permet de tester toutes ses fonctionnalités.

  • Intelligence documentaire propose un modèle de tarification sur engagement pour les charges de travail volumineuses.

En savoir plus sur les options tarifaires d’Azure AI Intelligence documentaire.

Comment puis-je vérifier mon utilisation d’Intelligence documentaire et estimer le coût ?

Vous trouverez les métriques d’utilisation dans le tableau de bord des métriques dans le Portail Azure. Le tableau de bord affiche le nombre de pages qu’Azure AI Intelligence documentaire traite. Vous pouvez obtenir une estimation des coûts de la ressource à l’aide de la Calculatrice de prix Azure. Pour obtenir des instructions détaillées, consultez Vérifier l’utilisation et estimer les coûts.

Quelles sont les meilleures pratiques pour atténuer la limitation de requêtes ?

Intelligence documentaire utilise la mise à l’échelle automatique pour fournir les ressources de calcul requises à la demande, tout en réduisant les coûts pour les clients. Pour atténuer la limitation de requêtes au cours de la mise à l’échelle automatique, nous vous recommandons l’approche suivante :

  • Implémentez une logique de nouvelle tentative dans votre application.

  • Si vous constatez que le nombre de demandes POST est limité, envisagez d’ajouter un délai entre les demandes.

  • Augmentez graduellement la charge de travail. Évitez les variations brutales.

  • Créez une demande de support pour augmenter la limite du nombre de transactions par seconde (TPS).

En savoir plus sur les quotas et les limites du service Document Intelligence.

Combien de temps faut-il pour analyser un document ?

La durée d’analyse d’un document dépend de la taille (par exemple le nombre de pages) et du contenu associé sur chaque page.

Intelligence documentaire est un service multilocataire où la latence des documents similaires est comparable, mais pas toujours identique. La latence est le délai nécessaire à un serveur d’API pour gérer et traiter une requête entrante et remettre la réponse sortante au client. Une variabilité occasionnelle de la latence et des performances est inhérente à tout service asynchrone basé sur les micro-services et sans état qui traite les images et les documents volumineux à grande échelle.

Bien que nous puissions mettre à l’échelle en permanence le matériel, les fonctionnalités et les capacités de mise à l’échelle, il est toujours possible que vous rencontriez des problèmes de latence au moment de l’exécution.

Modèles personnalisés

Comment assembler les meilleures données d’apprentissage possibles ?

Lorsque vous utilisez le modèle personnalisé d’Intelligence documentaire, vous fournissez vos propres données d’apprentissage. Voici quelques conseils pour vous aider à effectuer efficacement l'apprentissage de vos modèles :

  • Lorsque cela est possible, utilisez des fichiers PDF textuels plutôt que basés sur une image. Pour identifier un fichier PDF basé sur une image, vous pouvez essayer de sélectionner du texte dans le document. Si vous pouvez uniquement sélectionner la totalité de l’image du texte, cela signifie que le document est basé sur une image et non sur du texte.

  • Organisez vos documents d’apprentissage en utilisant un sous-dossier par format (JPEG/JPG, PNG, BMP, PDF ou TIFF).

  • Utilisez des formulaires dont tous les champs disponibles sont complétés.

  • Utilisez des formulaires comportant des valeurs différentes dans chaque champ.

  • Si vos images sont de basse qualité, utilisez un jeu de données plus volumineux (plus de cinq documents d’apprentissage).

Pour plus d’informations, consultez Création d’un jeu de données d’apprentissage.

Quelles sont les meilleures pratiques pour l’apprentissage d’un modèle personnalisé très précis ?

Le niveau d’exactitude de votre modèle dépend de la qualité de vos supports d’apprentissage. Voici quelques conseils :

  • Déterminez si vous devez utiliser un seul modèle ou plusieurs modèles composés en un modèle unique.

  • La précision du modèle peut diminuer quand vous avez différents formats à analyser avec ce même modèle. Envisagez de segmenter votre jeu de données en plusieurs dossiers, chacun d’eux correspondant à un modèle unique. Effectuez l’apprentissage d’un modèle par dossier et composez les modèles résultants dans un seul point de terminaison.

  • Les formulaires personnalisés s’appuient sur un modèle visuel cohérent. Si votre formulaire présente des variations de formats et de sauts de page, envisagez de segmenter votre jeu de données pour effectuer l'apprentissage de plusieurs modèles.

  • Vérifiez que vous disposez d’un jeu de données équilibré en tenant compte des formats, des types de documents et de la structure.

Pour plus d’informations, consultez Modèles composés.

Peut-on effectuer à nouveau l'apprentissage d’un modèle personnalisé ?

Intelligence documentaire ne comporte pas d’opération explicite de nouvel apprentissage. Chaque opération d’apprentissage génère un nouveau modèle.

Si vous constatez que votre modèle a besoin d’un nouvel apprentissage, ajoutez d’autres échantillons à votre jeu de données d’apprentissage et effectuez l’apprentissage d’un nouveau modèle.

Combien de modèles personnalisés peut-on composer en un seul ?

L’opération Composition de modèle permet d’affecter un ID de modèle unique à 200 modèles maximum. Quand vous faites la demande Analyze Document avec un ID de modèle composé, Intelligence documentaire classifie le formulaire soumis, choisit le meilleur modèle, puis retourne les résultats. La composition de modèle n’est à l’heure actuelle disponible que pour les modèles personnalisés entraînés avec des étiquettes.

L’analyse d’un document à l’aide de modèles composés est identique à l’analyse d’un document à l’aide d’un modèle unique. Le résultat Analyze Document retourne une propriété docType qui indique les modèles de composants que vous avez sélectionnés pour l’analyse du document. Les tarifs ne changent pas pour l’analyse d’un document à l’aide d’un modèle personnalisé ou d’un modèle personnalisé composé.

Pour plus d’informations, consultez Modèles composés.

Si le nombre de modèles que je souhaite composer dépasse la limite supérieure du modèle composé, quelles sont les alternatives ?

Vous pouvez utiliser l’une des options suivantes :

Comment affiner un modèle au-delà de l’apprentissage initial ?

Chaque opération d’apprentissage génère un nouveau modèle.

  1. Créez un jeu de données pour votre nouveau modèle.

  2. Étiquetez un nouveau modèle et effectuez-en l’apprentissage.

  3. Vérifiez que le nouveau modèle fonctionne correctement pour vos types de documents.

  4. Composez votre nouveau modèle avec le modèle existant dans un point de terminaison unique. Intelligence documentaire peut ensuite déterminer le modèle le mieux adapté pour chaque document à analyser.

Pour plus d’informations, consultez Modèles composés.

Je crée un modèle personnalisé. Que renvoie l’étiquette de détection de signature ?

La détection de signature recherche la présence d’une signature, et non l’identité de la personne qui signe le document.

Si le modèle retourne non signé pour la détection de signature, cela signifie qu’il n’a pas trouvé de signature dans le champ défini.

Que faut-il prendre en compte et quelles sont les meilleures pratiques pour extraire des tableaux à partir de documents ?

Vous pouvez commencer par le modèle de disposition d’Intelligence documentaire pour extraire des textes, des tableaux, des marquages de sélection et des informations de structure à partir de documents et d’images. Vous pouvez également tenir compte des facteurs suivants :

  • Les données que vous voulez extraire sont-elles présentées sous forme de tableau ? La structure du tableau est-elle significative ?

  • Si les données ne sont pas au format tableau, peuvent-elles être contenues dans une grille à deux dimensions ?

  • Vos tableaux s’étendent-ils sur plusieurs pages ? Si tel est le cas, pour éviter d’avoir à étiqueter toutes les pages, divisez le PDF en pages avant de l’envoyer à Intelligence documentaire. Après l’analyse, effectuez un post-traitement des pages dans un tableau unique.

  • Si vous créez des modèles personnalisés, consultez Étiquetage en tant que tableaux. Les tableaux dynamiques contiennent un nombre variable de lignes pour chaque colonne. Les tableaux fixes, eux, contiennent un nombre constant de lignes pour chaque colonne.

Comment puis-je déplacer mes modèles entraînés d’un environnement (comme une version bêta) vers un autre (comme la production) ?

Vous pouvez utiliser l’API Copier pour copier des modèles personnalisés d’un compte Intelligence documentaire dans d’autres régions géographiques prises en charge. Pour obtenir des instructions détaillées, consultez Récupération d’urgence.

L’opération de copie est limitée à la copie de modèles dans l’environnement cloud spécifique dans lequel vous avez formé le modèle. Par exemple, la copie de modèles du cloud public vers Azure Government Cloud n’est pas prise en charge.

Pourquoi ai-je été facturé pour le modèle de disposition lors de l’exécution d’un apprentissage personnalisé ?

Une disposition est nécessaire afin de générer des étiquettes pour votre jeu de données. Si le jeu de données que vous utilisez pour l’apprentissage personnalisé n’a pas de fichiers d’étiquettes disponibles, le service les génère pour vous.

Compte de stockage

J’ai pu accéder à mon compte de stockage il y a quelques jours. Pourquoi ne puis-je pas me reconnecter maintenant ?

Lorsque vous créez une signature d’accès partagé, la durée par défaut est de 48 heures. Passé ce délai, vous devrez créer un nouveau jeton.

Envisagez de définir une durée plus longue pour le délai pendant lequel vous utilisez votre compte de stockage avec Intelligence documentaire.

Si mon compte de stockage se trouve derrière un réseau virtuel ou un pare-feu, comment autoriser Intelligence documentaire à accéder aux données ?

Si vous disposez d’un compte de stockage Azure protégé par un réseau virtuel ou un pare-feu, Intelligence documentaire ne peut pas accéder directement à votre compte de stockage. Cependant, l’accès et l’authentification des comptes de stockage Azure privés prennent en charge les identités managées pour les ressources Azure. Lorsque vous utilisez une identité managée, le service Intelligence documentaire peut accéder à votre compte de stockage à l’aide des informations d’identification affectées.

Si vous envisagez d’analyser les données de votre compte de stockage privé à l’aide de FOTT, vous devez déployer l’outil derrière le réseau virtuel ou le pare-feu.

Découvrez comment créer et utiliser une identité managée pour votre ressource Document Intelligence.

Document Intelligence Studio

De quelles permissions ai-je besoin pour accéder à Document Intelligence Studio ?

Vous avez besoin d’un compte Azure actif et d’un abonnement avec au moins un rôle de Lecteur pour accéder à Document Intelligence Studio.

Pour l’analyse des documents et les modèles prédéfinis, voici les exigences de rôle pour les scénarios utilisateur :

  • De base

  • Avancé

    • Contributeur : vous avez besoin de ce rôle pour créer un groupe de ressources ou une ressource Intelligence documentaire. Le rôle de Contributeur ne vous permet pas de répertorier les clés pour Cognitive Services. Pour utiliser Document Intelligence Studio, vous avez toujours besoin du rôle d’Utilisateur Cognitive Services.

Pour les projets de modèle personnalisés, voici les exigences de rôle pour les scénarios utilisateur :

  • De base

    • Utilisateur Cognitive Services : vous avez besoin de ce rôle pour une ressource Intelligence documentaire ou Azure Cognitive Services multiservices pour effectuer l’apprentissage d’un modèle ou effectuer des analyses à l’aide des modèles formés.

    • Contributeur aux données BLOB du stockage : vous avez besoin de ce rôle pour un compte de stockage afin de créer des données de projet et d’étiquette.

  • Avancé

    • Contributeur au compte de stockage : vous avez besoin de ce rôle pour que le compte de stockage configure les paramètres de partage de ressources cross-origin (CORS). Si vous réutilisez le même compte de stockage, cela ne sera fait qu’une fois.

      Le rôle Contributeur ne vous permet pas d’accéder aux données dans votre objet BLOB. Pour utiliser Document Intelligence Studio, vous avez toujours besoin du rôle Contributeur aux données BLOB du stockage.

    • Contributeur : vous avez besoin de ce rôle pour créer un groupe de ressources et des ressources. Le rôle Contributeur ne vous permet pas d’utiliser les ressources ou le stockage créés. Pour utiliser Document Intelligence Studio, vous avez toujours besoin de rôles de base.

Pour plus d’informations, consultez Rôles intégrés Microsoft Entra et les sections sur les attributions de rôles Azure dans le Démarrage rapide Document Intelligence Studio.

J’ai plusieurs pages dans un document. Pourquoi seules deux pages sont analysées dans Document Intelligence Studio ?

Pour les ressources de niveau gratuit (F0), seules les deux premières pages sont analysées, que vous utilisiez Document Intelligence Studio, l’API REST ou les kits de développement logiciels (SDK).

Dans Document Intelligence Studio, sélectionnez le bouton Paramètres (engrenage), puis l’onglet Ressources et vérifiez le niveau de tarification que vous utilisez pour analyser les documents. Si vous souhaitez analyser toutes les pages d’un document, passez à une ressource payante (S0).

Comment puis-je modifier les répertoires ou les abonnements dans Document Intelligence Studio ?

Pour modifier un répertoire dans Document Intelligence Studio, sélectionnez le bouton Paramètres (engrenage). Sous Répertoire, sélectionnez le répertoire dans la liste, puis Changer de répertoire. Vous êtes invité à vous reconnecter après avoir changé de répertoire.

Pour modifier un abonnement ou une ressource, accédez à l’onglet Ressource sous Paramètres.

Pourquoi est-ce que je reçois une erreur de stockage sur une opération de partage de projet, d’étiquetage automatique ou de mise à niveau OCR lorsque ma ressource Compte de stockage est configurée avec un pare-feu ou un réseau virtuel ?

Reportez-vous à Identités managées pour Intelligence documentaire pour configurer vos ressources Azure.

Pourquoi est-ce que je reçois l’erreur « Accès refusé en raison de règles de réseau virtuel/pare-feu » sur une opération d’étiquetage automatique ou de mise à niveau OCR lorsque ma ressource Intelligence documentaire est configurée avec un pare-feu ou un réseau virtuel ?

Vous devez ajouter l’adresse IP dédiée 20.3.165.95 à la liste d’autorisation du pare-feu pour votre ressource Intelligence documentaire.

Puis-je réutiliser ou personnaliser l’expérience d’étiquetage de Document Intelligence Studio et l’intégrer dans ma propre application ?

Oui. L’expérience d’étiquetage de Document Intelligence Studio est disponible en open source dans le référentiel Toolkit.

Pourquoi est-ce que je reçois l’erreur « Form Recognizer introuvable » lorsque j’ouvre mon projet personnalisé ?

Votre ressource Intelligence documentaire liée à ce projet personnalisé a été supprimée ou déplacée vers un autre groupe de ressources. Il existe deux façons de résoudre ce problème :

  • Recréez la ressource Intelligence documentaire sous le même abonnement et groupe de ressources avec le même nom.

  • Recréez un projet personnalisé avec la ressource Document Intelligence migrée et spécifiez le même compte de stockage.

conteneurs

Une connexion Internet est-elle nécessaire pour utiliser des conteneurs Intelligence documentaire ?

Oui. Les conteneurs Intelligence documentaire ont besoin d’une connexion Internet pour envoyer des informations de facturation à Azure. Pour plus d’informations, consultez Sécurité des conteneurs Azure.

Quelle est la différence entre les conteneurs déconnectés et les conteneurs connectés ?

Les conteneurs connectés envoient des informations de facturation à Azure à l’aide d’une ressource Intelligence documentaire de votre compte Azure. Avec les conteneurs connectés, l’envoi des informations de facturation à Azure nécessite une connexion Internet.

Les conteneurs déconnectés vous permettent d’utiliser des API non connectées à Internet. Les informations de facturation ne sont pas envoyées via Internet. Au lieu de cela, vous êtes facturé sur la base d’un niveau d’engagement acheté. À l’heure actuelle, l’utilisation d’un conteneur déconnecté est réservée aux modèles personnalisés et de facturation Intelligence documentaire.

Les capacités de modèles proposées dans les conteneurs connectés et déconnectés sont identiques et sont prises en charge par la version 2.1 d’Intelligence documentaire.

Quelles sont les données que les conteneurs connectés envoient au cloud ?

Les conteneurs connectés Intelligence documentaire envoient des informations de facturation à Azure à l’aide d’une ressource Intelligence documentaire de votre compte Azure. Les conteneurs connectés n’envoient pas de données client à Microsoft, telles que l’image ou le texte analysé.

Pour obtenir un exemple des informations que les conteneurs connectés envoient à Microsoft pour la facturation, consultez la FAQ sur les conteneurs Azure AI.

Pourquoi est-ce que je reçois l’erreur « Le conteneur n’est pas dans un état valide. Échec de la validation de l’abonnement avec état clé API “OutOfQuota” est hors quota » ?

Les conteneurs connectés Intelligence documentaire envoient des informations de facturation à Azure à l’aide d’une ressource Intelligence documentaire de votre compte Azure. Vous pouvez obtenir ce message si les conteneurs ne peuvent pas communiquer avec le point de terminaison de facturation.

Puis-je utiliser le stockage local pour le conteneur de l’outil d’étiquetage d’échantillon (FOTT) d’Intelligence documentaire ?

FOTT a une version qui utilise le stockage local. La version doit être installée sur un ordinateur Windows. Vous pouvez l’installer à partir de cet emplacement.

Sur la page du projet, spécifiez l’URI du dossier d’étiquettes au format /shared ou /shared/sub-dir si vos fichiers d’étiquetage se trouvent dans un sous-répertoire. Le comportement de tous les autres outils d’étiquetage d’échantillon d’Intelligence documentaire est le même que celui du service hébergé.

Quelle est la bonne pratique pour effectuer un scale-up ?

Pour les appels asynchrones, vous pouvez exécuter plusieurs conteneurs avec un stockage partagé. Le conteneur qui traite l’appel POST Analyze stocke la sortie dans le stockage. Ensuite, n’importe quel autre conteneur peut récupérer les résultats du stockage et servir les appels GET. Ainsi, l’ID de requête n’est pas lié à un conteneur.

Pour les appels synchrones, vous pouvez exécuter plusieurs conteneurs, mais un seul conteneur répond à une demande. Étant donné qu’il s’agit d’un appel bloquant, n’importe quel conteneur du pool peut répondre à la requête et envoyer la réponse. Ici, un seul conteneur est lié à une requête à la fois et aucune interrogation n’est requise.

Comment configurer des conteneurs avec un stockage partagé ?

Les conteneurs utilisent la propriété Mounts:Shared lors du démarrage pour spécifier le stockage partagé pour stocker les fichiers de traitement. Pour voir l’utilisation de cette propriété, reportez-vous à la documentation sur les conteneurs.

Sécurité et confidentialité

Quelles sont les méthodes et exigences relatives à l’authentification des demandes auprès d’Azure AI services ?

Chaque demande adressée à un service Azure doit inclure un en-tête d’authentification. Il existe plusieurs méthodes permettant d’authentifier une demande :

Le service Intelligence documentaire stocke-t-il mes données ?

Pour toutes les fonctionnalités, Intelligence documentaire stocke temporairement les données et les résultats dans Stockage Azure, dans la même région que la requête. Vos données sont ensuite supprimées dans les 24 heures qui suivent le moment où vous envoyez une demande d’analyse.

En savoir plus à propos des données, de la confidentialité et de la sécurité avec Intelligence documentaire.

Comment mes modèles personnalisés formés sont-ils stockés et utilisés dans Intelligence documentaire ?

Les sorties intermédiaires après l’analyse et l’étiquetage sont stockées dans le même emplacement de Stockage Azure que celui où vous stockez vos données d’apprentissage. Les modèles personnalisés formés sont stockés dans Stockage Azure dans la même région, et sont isolés logiquement avec votre abonnement Azure et vos informations d’identification d’API.

Aide et support supplémentaires

Où trouver d’autres solutions à mes questions sur Azure AI Intelligence documentaire ?

Vous trouverez des questions techniques et leurs réponses dans Microsoft Q&A. Vous pouvez filtrer les requêtes spécifiques à Intelligence documentaire.

Que dois-je faire si le service ne reconnaît pas un texte spécifique ou ne le reconnaît pas correctement lorsque j’étiquette des documents ?

Nous mettons à jour et améliorons continuellement le modèle OCR d’Intelligence documentaire. Vous pouvez envoyer un e-mail à l’équipe Intelligence documentaire. Si possible, partagez un exemple de document mettant en évidence le problème.