Partager via


Qu’est-ce que Document Intelligence Studio ?

Ce contenu s’applique à  coche v4.0 (préversion) | Versions précédentes :coche-bleue v3.1 (GA) coche-bleue v3.0 (GA)

Important

Document Intelligence Studio est un outil en ligne permettant d'explorer visuellement, de comprendre, de former et d'intégrer les fonctionnalités du service Document Intelligence dans vos applications. Le studio fournit une plateforme qui vous permet d’expérimenter les différents modèles d’Intelligence documentaire et d’échantillonner les données retournées de manière interactive sans avoir besoin d’écrire du code. Utilisez le Studio d’Intelligence documentaire pour :

  • En savoir plus sur les différentes fonctionnalités d’Intelligence documentaire.
  • Utiliser votre ressource d’Intelligence documentaire pour tester des modèles sur des exemples de documents ou charger vos propres documents.
  • Expérimenter différents modules complémentaires et différentes fonctionnalités d’évaluation pour adapter la sortie à vos besoins.
  • Effectuer l’apprentissage de modèles de classification personnalisés pour classifier des documents.
  • Effectuer l’apprentissage de modèles d’extraction personnalisés pour extraire des champs à partir de documents.
  • Obtenez un exemple de code pour le langage spécifique SDKs à intégrer à vos applications.

Le Studio prend en charge Intelligence documentaire v3.0 et versions ultérieures de l’API pour l’analyse des modèles et la formation de modèles personnalisés. Les modèles v2.1 ayant précédemment effectué l’apprentissage avec des données étiquetées sont pris en charge, mais pas l’apprentissage de modèle v2.1. Pour obtenir des informations détaillées sur la migration de la version v2.1 vers la version v3.0, consultez le Guide de migration de l’API REST.

Utilisez le démarrage rapide du studio d’Intelligence documentaire pour bien démarrer l’analyse des documents avec l’analyse de documents ou des modèles prédéfinis. Créez des modèles personnalisés et faites-y référence dans vos applications en utilisant l’un des SDKs propres au langage. Pour pouvoir utiliser Document Intelligence Studio, vous devez vous procurer les ressources suivantes depuis le portail Azure :

  • Un abonnement Azure - Créez-en un gratuitement.

  • Une ressource Azure AI services ou Document Intelligence. Une fois que vous avez votre abonnement Azure, créez une ressource monoservice ou multiservice dans le portail Azure pour obtenir votre clé et votre point de terminaison. Utilisez le niveau tarifaire Gratuit (F0) pour tester le service, puis effectuez par la suite une mise à niveau vers un niveau payant pour la production.

Vous pouvez également utiliser les stratégies d'autorisation

Votre organisation peut choisir de désactiver l’authentification locale et d’appliquer l’authentification Microsoft Entra (anciennement Azure Active Directory) pour les ressources Azure AI Document Intelligence et le stockage d’objets blob Azure.

Important

  • Vérifiez que vous disposez du rôle Utilisateur Cognitive Services et non du rôle Contributeur Cognitive Services lors de la configuration de l’authentification Entra.
  • Dans le contexte d’Azure, le rôle Contributeur peut uniquement effectuer des actions pour contrôler et gérer la ressource elle-même, notamment l’affichage de la liste des clés d’accès.
  • Les comptes d’utilisateurs dotés d’un Contributeur ne peuvent accéder au service Document Intelligence qu’en appellent avec des clés d’accès. Cependant, durant la configuration de l’accès avec Entra ID, l’accès par clé est désactivé et le rôle Utilisateur Cognitive Services est nécessaire pour permettre à un compte d’utiliser les ressources.

Prise en charge de modèle Intelligence Document

Utilisez l’Assistant, l’interface d’étiquetage, l’étape d’entraînement et les visualisations interactives pour comprendre le fonctionnement de chaque fonctionnalité.

  • Lecture : testez la fonctionnalité de lecture de Document Intelligence Studio avec des exemples de documents ou vos propres documents pour extraire des lignes de texte, des mots, les langues détectées et le style manuscrit, le cas échéant. Pour plus d’informations, consultez la vue d’ensemble de la fonctionnalité de lecture.

  • Disposition : testez la fonctionnalité Disposition de Document Intelligence Studio avec des exemples de documents ou vos propres documents pour extraire du texte, des tableaux, des marques de sélection et des informations de structure. Pour plus d’informations, consultez la vue d’ensemble de la fonctionnalité Disposition.

  • Modèles prédéfinis : les modèles prédéfinis de Document Intelligence vous permettent d’ajouter un traitement intelligent des documents à vos applications et à vos flux sans avoir à effectuer l’apprentissage et la construction de vos propres modèles. Par exemple, commencez avec la fonctionnalité Facture Studio. Pour plus d’informations, consultez la vue d’ensemble de la fonctionnalité Modèles.

  • Modèles d’extraction personnalisés : la fonctionnalité Modèles personnalisés de Document Intelligence Studio vous permet d’extraire des champs et des valeurs de modèles entraînés avec vos données, adaptés à vos formulaires et documents. Pour extraire des données de plusieurs types de formulaires, créez des modèles personnalisés autonomes ou combinez plusieurs modèles personnalisés afin de créer un modèle composé. Testez le modèle personnalisé à l’aide de vos exemples de documents et procédez par itération pour améliorer le modèle. Pour plus d’informations, consultez la vue d’ensemble de la fonctionnalité Modèles personnalisés.

  • Modèles de classification personnalisés : la classification de documents est un nouveau scénario pris en charge par Document Intelligence. L’API classifieur de document prend en charge les scénarios de classification et de fractionnement. Effectuez l'apprentissage d’un modèle de classification pour identifier les différents types de documents pris en charge par votre application. Le fichier d’entrée du modèle de classification peut contenir plusieurs documents et classifie chaque document dans une plage de pages associée. Pour en savoir plus, consultez Modèles de classification personnalisés.

  • Fonctionnalités de modules complémentaires : Document Intelligence prend en charge des fonctionnalités d’analyse plus sophistiquées. Ces fonctionnalités facultatives peuvent être activées et désactivées dans le studio à l’aide du Analyze Options bouton dans chaque page de modèle. Quatre fonctionnalités de modules complémentaires sont disponibles : highResolution, formula, font et barcode extraction. Pour en savoir plus, consultez Fonctionnalités de module complémentaire.

Essayer un modèle Document Intelligence

  • Une fois votre ressource configurée, vous pouvez essayer les différents modèles proposés par Document Intelligence Studio. Dans la page d’accueil, sélectionnez un modèle Document Intelligence pour essayer de l’utiliser avec une approche no-code.

  • Pour tester l’analyse de document ou les modèles prédéfinis, sélectionnez le modèle et utilisez l’un des exemples de documents ou chargez votre propre document pour analyser. Le résultat d’analyse s’affiche à droite dans la fenêtre de code de résultat de contenu.

  • Les modèles personnalisés doivent être formés sur vos documents. Consultez cette rubrique pour obtenir une vue d’ensemble des modèles personnalisés.

  • Après avoir validé le scénario dans Document Intelligence Studio, utilisez les bibliothèques clientes C#, Java, JavaScript ou Python ou l'API REST pour commencer à intégrer des modèles Document Intelligence dans vos propres applications.

Pour en savoir plus sur chaque modèle, consultez nos pages de concept.

Afficher les détails de la ressource

Pour afficher les détails d’une ressource, tels que son nom et son niveau tarifaire, sélectionnez l’icône Paramètres dans l’angle supérieur droit de la page d’accueil de Document Intelligence Studio, puis sélectionnez l’onglet Ressource. Si vous avez accès à d’autres ressources, vous pouvez également changer de ressource.

Capture d’écran de l’onglet Ressource de la page Paramètres du studio.

Grâce à Document Intelligence, vous pouvez rapidement automatiser votre traitement des données dans les applications et les flux de travail, améliorer facilement des stratégies pilotées par les données et enrichir habilement les capacités de recherche de documents.

Options d’analyse

  • Intelligence documentaire prend en charge des fonctionnalités d’analyse sophistiquées. Studio autorise un point d’entrée (bouton Analyser les options) pour configurer facilement les fonctionnalités de modules complémentaires.

  • En fonction du scénario d’extraction de document, configurez la plage d’analyse, la plage de pages de document, la détection facultative et les fonctionnalités de détection Premium.

    Capture d'écran de la fenêtre de dialogue des options d'analyse.

    Remarque

    L’extraction de police n’est pas visualisées dans Document Intelligence Studio. Toutefois, vous pouvez vérifier la section de styles de la sortie JSON pour obtenir les résultats de la détection de police.

Étiqueter automatiquement des documents avec des modèles prédéfinis ou l’un de vos propres modèles

  • Dans la page d'étiquetage du modèle d'extraction personnalisé, vous pouvez désormais étiqueter automatiquement vos documents à l'aide de l'un des modèles prédéfinis de Document Intelligent Service ou de vos modèles entraînés.

    Capture d'écran animée montrant l'étiquetage automatique dans Studio.

  • Pour certains documents, il peut y avoir des étiquettes en double après l’exécution de l’étiquette automatique. Veillez à modifier les étiquettes afin qu’il n’y ait pas d’étiquettes en double dans la page d’étiquetage par la suite.

    Capture d'écran montrant l'avertissement d'étiquette en double après l'étiquetage automatique.

Tables d’étiquettes automatiques

  • Dans la page d’étiquetage du modèle d’extraction personnalisée, vous pouvez désormais étiqueter automatiquement les tables du document sans avoir à étiqueter les tables manuellement.

    Capture d'écran animée montrant l'étiquetage de table automatique dans Studio.

Ajouter des fichiers de test directement à votre jeu de données d’entraînement

  • Une fois que vous avez entraîné un modèle d’extraction personnalisé, utilisez la page de test pour améliorer la qualité de votre modèle en chargeant des documents de test dans un jeu de données d’entraînement si nécessaire.

  • Si un score de confiance faible est retourné pour certaines étiquettes, veillez à étiqueter correctement votre contenu. Si ce n’est pas le cas, ajoutez-les au jeu de données d’entraînement et réétiquetez pour améliorer la qualité du modèle.

    Capture d'écran animée montrant comment ajouter des fichiers de test à l'ensemble de données de formation.

Utiliser les options de liste de documents et les filtres dans les projets personnalisés

  • Utilisez la page d’étiquetage de modèles d’extraction personnalisés afin de naviguer facilement parmi vos documents de formation en utilisant la fonctionnalité de recherche, de filtrage et de tri.

  • Utilisez le mode grille pour afficher un aperçu des documents ou utilisez l’affichage liste pour faire défiler les documents plus facilement.

    Capture d'écran des options et filtres d'affichage de la liste des documents.

Partage de projet

Partagez facilement des projets d’extraction personnalisés. Pour plus d’informations, consultez Partage de projet avec des modèles personnalisés.

Dépannage

Scénario Cause Résolution
Vous obtenez le message d’erreur
Form Recognizer Not Found au moment d’ouvrir un projet personnalisé.
Votre ressource Document Intelligence liée au projet personnalisé a été supprimée ou déplacée vers un autre groupe de ressources. Il existe deux façons de résoudre ce problème :
• Recréer la ressource Document Intelligence sous le même abonnement et le même groupe de ressources avec le même nom.
• Recréer un projet personnalisé avec la ressource Document Intelligence migrée et spécifier le même compte de stockage.
Vous obtenez le message d’erreur
PermissionDenied lors de l’utilisation d’applications prédéfinies ou de l’ouverture d’un projet personnalisé.
Le principal n’a pas accès à l’API/Opération lors de l’analyse par rapport à des modèles prédéfinis ou lors de l’ouverture d’un projet personnalisé. Il est probable que l’authentification locale (basée sur une clé) est désactivée, car votre ressource Document Intelligence ne dispose pas d’une autorisation suffisante pour accéder à la ressource. Référencez des attributions de rôles Azure pour configurer vos rôles d’accès.
Vous obtenez le message d’erreur
AuthorizationPermissionMismatch au moment d’ouvrir un projet personnalisé.
La demande n’est pas autorisée à effectuer l’opération à partir de l’autorisation désignée. Il est probable que l’authentification locale (basée sur une clé) est désactivée, car l’autorisation accordée à votre compte de stockage ne lui permet pas d’accéder aux données blob. Référencez des attributions de rôles Azure pour configurer vos rôles d’accès.
Vous ne pouvez pas vous connecter à Document Intelligence Studio et obtenir le message d’erreur
InteractionRequiredAuthError:login_required:AADSTS50058:A silent sign-request was sent but no user is signed in
Il est probable que votre navigateur bloque les cookies tiers, ce qui vous empêche de vous connecter. Pour résoudre ce problème, consultez Gérer les paramètres tiers pour votre navigateur.

Gérer les paramètres tiers pour l’accès Studio

Edge :

  • Accédez à Paramètres pour Edge
  • Lancez une recherche sur le mot « tiers »
  • Accédez à Gérer et supprimer des cookies et des données de site
  • Désactivez le paramètre Bloquer les cookies tiers

Chrome :

  • Accédez à Paramètres pour Chrome
  • Lancez une recherche sur le mot « tiers »
  • Sous Comportement par défaut, sélectionnez Autoriser les cookies tiers

Firefox :

  • Accédez à Paramètres pour Firefox
  • Rechercher « cookies »
  • Sous Protection améliorée du suivi, sélectionnez Gérer les exceptions
  • Ajouter une exception pour https://documentintelligence.ai.azure.com ou l’URL Document Intelligence Studio de votre environnement

Safari :

  • Choisissez Préférences>Safari
  • Sélectionnez Confidentialité
  • Désélectionnez Bloquer tous les cookies

Étapes suivantes