Partage via


Document Intelligence Studio

Important

  • Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif.
  • Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
  • La version d'aperçu publique des bibliothèques clientes Document Intelligence est par défaut la version 2024-02-29-preview de l'API REST.
  • La version d’évaluation publique 2024-02-29-preview est actuellement disponible uniquement dans les régions Azure suivantes :
  • USA Est
  • USA Ouest 2
  • Europe Ouest

Ce contenu s’applique à :cochev4.0 (préversion) | Versions précédentes :coche-bleuev3.1 (GA)coche-bleuev3.0 (GA)

Ce contenu s’applique à :cocheversion 3.1 (GA) | Dernière version :coche violettev4.0 (préversion) | Versions précédentes :coche-bleuev3.0

Ce contenu s’applique à :cochev3.0 (Disponibilité générale) | Dernières versions :coche violettev4.0 (préversion)coche violettev3.1

Important

Document Intelligence Studio est un outil en ligne permettant d’explorer, de comprendre et d’intégrer visuellement des fonctionnalités du service Intelligence documentaire dans vos applications. Utilisez le Studio d’Intelligence documentaire pour :

  • En savoir plus sur les différentes fonctionnalités d’Intelligence documentaire.
  • Utiliser votre ressource d’Intelligence documentaire pour tester des modèles sur des exemples de documents ou charger vos propres documents.
  • Expérimenter différents modules complémentaires et différentes fonctionnalités d’évaluation pour adapter la sortie à vos besoins.
  • Effectuer l’apprentissage de modèles de classification personnalisés pour classifier des documents.
  • Effectuer l’apprentissage de modèles d’extraction personnalisés pour extraire des champs à partir de documents.
  • Obtenez un exemple de code pour le SDKs propre au langage à intégrer à vos applications.

Utilisez le démarrage rapide du studio d’Intelligence documentaire pour bien démarrer l’analyse des documents avec l’analyse de documents ou des modèles prédéfinis. Générez des modèles personnalisés et référencez les modèles dans vos applications à l’aide de l’un des SDKs propres au langage et d’autres guides de démarrage rapide.

Mise en route

Si vous visitez le studio pour la première fois, suivez le Guide de démarrage pour configurer le Studio à utiliser.

Options d’analyse

  • Intelligence documentaire prend en charge des fonctionnalités d’analyse sophistiquées. Studio autorise un point d’entrée (bouton Analyser les options) pour configurer facilement les fonctionnalités de modules complémentaires.

  • En fonction du scénario d’extraction de document, configurez la plage d’analyse, la plage de pages de document, la détection facultative et les fonctionnalités de détection Premium.

    Capture d'écran de la fenêtre de dialogue des options d'analyse.

    Remarque

    L’extraction de police n’est pas visualisées dans Document Intelligence Studio. Toutefois, vous pouvez vérifier la section de styles de la sortie JSON pour obtenir les résultats de la détection de police.

✔️ Étiquetage automatique des documents avec des modèles prédéfinis ou l’un de vos propres modèles

  • Dans la page d'étiquetage du modèle d'extraction personnalisé, vous pouvez désormais étiqueter automatiquement vos documents à l'aide de l'un des modèles prédéfinis de Document Intelligent Service ou de vos modèles entraînés.

    Capture d'écran animée montrant l'étiquetage automatique dans Studio.

  • Pour certains documents, il peut y avoir des étiquettes en double après l’exécution de l’étiquette automatique. Veillez à modifier les étiquettes afin qu’il n’y ait pas d’étiquettes en double dans la page d’étiquetage par la suite.

    Capture d'écran montrant l'avertissement d'étiquette en double après l'étiquetage automatique.

✔️ Tables d’étiquetage automatique

  • Dans la page d’étiquetage du modèle d’extraction personnalisée, vous pouvez désormais étiqueter automatiquement les tables du document sans avoir à étiqueter les tables manuellement.

    Capture d'écran animée montrant l'étiquetage de table automatique dans Studio.

✔️ Ajouter des fichiers de test directement à votre jeu de données d’entraînement

  • Une fois que vous avez entraîné un modèle d’extraction personnalisé, utilisez la page de test pour améliorer la qualité de votre modèle en chargeant des documents de test dans un jeu de données d’entraînement si nécessaire.

  • Si un score de confiance faible est retourné pour certaines étiquettes, assurez-vous qu’elles sont correctement étiquetées. Si ce n’est pas le cas, ajoutez-les au jeu de données d’entraînement et réétiquetez pour améliorer la qualité du modèle.

Capture d'écran animée montrant comment ajouter des fichiers de test à l'ensemble de données de formation.

✔️ Utiliser les options de liste de documents et les filtres dans les projets personnalisés

  • Utilisez la page d’étiquetage de modèles d’extraction personnalisés afin de naviguer facilement parmi vos documents de formation en utilisant la fonctionnalité de recherche, de filtrage et de tri.

  • Utilisez le mode grille pour afficher un aperçu des documents ou utilisez l’affichage liste pour faire défiler les documents plus facilement.

    Capture d'écran des options et filtres d'affichage de la liste des documents.

✔️ Partage de projet

Prise en charge de modèle Intelligence Document

  • Read : essayez la fonctionnalité Read de Document Intelligence pour extraire les lignes de texte, les mots, les langues détectées et le style manuscrit s’il est détecté. Démarrez avec la fonctionnalité Read Studio. Explorez la fonctionnalité à l’aide d’exemples de documents et de vos documents. Utilisez la visualisation interactive et la sortie JSON pour comprendre le fonctionnement de la fonctionnalité. Consultez la présentation de Read pour en savoir plus et commencez par le démarrage rapide du kit SDK Python pour Disposition.

  • Disposition : essayez la fonctionnalité Disposition de Document Intelligence pour extraire le texte, les tableaux, les marques de sélection et les informations de structure. Commencez par la fonctionnalité Disposition Studio. Explorez la fonctionnalité à l’aide d’exemples de documents et de vos documents. Utilisez la visualisation interactive et la sortie JSON pour comprendre le fonctionnement de la fonctionnalité. Consultez la présentation de Disposition pour en savoir plus et commencez par le démarrage rapide du Kit de développement logiciel (SDK) Python pour Disposition.

  • Modèles prédéfinis : les modèles prédéfinis de Document Intelligence vous permettent d’ajouter un traitement intelligent des documents à vos applications et à vos flux sans avoir à effectuer l’apprentissage et la construction de vos propres modèles. Par exemple, commencez avec la fonctionnalité Facture Studio. Explorez la fonctionnalité à l’aide d’exemples de documents et de vos documents. Utilisez la visualisation interactive, la liste des champs extraits et la sortie JSON pour comprendre le fonctionnement de la fonctionnalité. Consultez la présentation de Modèles pour en savoir plus et commencez par le démarrage rapide du Kit de développement logiciel (SDK) Python pour Facture prédéfinie.

  • Modèles d'extraction personnalisés : les modèles personnalisés de Document Intelligence vous permettent d'extraire des champs et des valeurs à partir de modèles formés avec vos données, adaptés à vos formulaires et documents. Pour extraire des données de plusieurs types de formulaires, créez des modèles personnalisés autonomes ou combinez plusieurs modèles personnalisés afin de créer un modèle composé. Commencez par la fonctionnalité Modèles personnalisés Studio. Utilisez l’Assistant, l’interface d’étiquetage, l’étape de formation et les visualisations pour comprendre le fonctionnement de la fonctionnalité. Testez le modèle personnalisé à l’aide de vos exemples de documents et procédez par itération pour améliorer le modèle. Pour en savoir plus, consultez la Vue d’ensemble des modèles personnalisés.

  • Modèles de classification personnalisés : la classification de documents est un nouveau scénario pris en charge par Document Intelligence. l’API classifieur de document prend en charge les scénarios de classification et de fractionnement. Effectuez l'apprentissage d’un modèle de classification pour identifier les différents types de documents pris en charge par votre application. Le fichier d’entrée du modèle de classification peut contenir plusieurs documents et classifie chaque document dans une plage de pages associée. Pour en savoir plus, consultez Modèles declassification personnalisés.

  • Fonctionnalités complémentaires : Document Intelligence prend désormais en charge des fonctionnalités d’analyse plus sophistiquées. Ces fonctionnalités facultatives peuvent être activées et désactivées dans le studio à l’aide du Analze Options bouton dans chaque page de modèle. Quatre fonctionnalités complémentaires sont disponibles : haute résolution, formule, police et extraction de codes-barres. Pour en savoir plus , consultezFonctionnalités de module complémentaire.

Étapes suivantes