Utiliser Document Intelligence Studio

Effectué

Tip

Pour plus d’informations, consultez l’onglet Texte et images !

Azure Document Intelligence Studio est un outil en ligne permettant d’explorer, de comprendre et d’intégrer visuellement les fonctionnalités du service Document Intelligence. Vous pouvez utiliser Studio pour analyser les dispositions de formulaire, extraire des données à partir de modèles prédéfinis et entraîner des modèles personnalisés, tout au long d’une interface visuelle.

Vous pouvez accéder à Studio à documentintelligence.ai.azure.com.

Capture d’écran montrant la page d'accueil de Document Intelligence Studio.

Fonctionnalités de Studio

Document Intelligence Studio prend en charge les types de projets suivants :

  • Modèles d’analyse de documents : testez les modèles de lecture et de disposition sur vos propres documents pour voir le texte extrait, les tableaux et la structure.

  • Modèles prédéfinis : analysez les documents à l’aide de n’importe quel modèle prédéfini disponible, comme les factures, les reçus, les documents d’ID et les formulaires fiscaux disponibles.

  • Modèles personnalisés : Générer, étiqueter, entraîner et tester des modèles d’extraction personnalisés et des classifieurs personnalisés.

Analyser des documents avec des modèles prédéfinis

Pour extraire des données de documents à l’aide de modèles prédéfinis dans Studio :

  1. Créez une ressource Azure Document Intelligence ou Foundry Tools dans le portail Azure.
  2. Ouvrez Document Intelligence Studio et sélectionnez un modèle prédéfini (par exemple, Facture, Reçu ou Document d’ID).
  3. Fournissez votre point de terminaison de ressource et votre clé.
  4. Chargez ou fournissez une URL vers le document que vous souhaitez analyser.
  5. Passez en revue les champs extraits et leurs scores de confiance.

Créer des projets de modèle personnalisé

Vous pouvez utiliser Studio pour gérer l’ensemble du processus d’étiquetage, d’entraînement et de test de modèles personnalisés, sans créer manuellement de fichiers JSON. Le Studio génère automatiquement les fichiers ocr.json, labels.json et fields.json requis.

Le flux de travail de haut niveau est le suivant :

  1. Créez une ressource Azure Document Intelligence ou Foundry.
  2. Chargez au moins 5 à 6 exemples de formulaires dans un conteneur Stockage Blob Azure.
  3. Configurez le partage de ressources inter-origines (CORS) afin que Studio puisse accéder à votre conteneur de stockage.
  4. Créez un projet de modèle personnalisé dans Studio, en liant votre conteneur de stockage et votre ressource Document Intelligence.
  5. Étiqueter des champs dans vos exemples de documents à l’aide de l’interface visuelle de Studio.
  6. Entraîner votre modèle et passer en revue les métriques de précision.
  7. Testez le modèle sur un nouveau document qui n’a pas été utilisé pendant l’entraînement.

Vous en apprendrez davantage sur les types de modèles personnalisés et le flux de travail d’entraînement de l’API REST/sdk de remplacement dans l’unité Entraîner et utiliser des modèles personnalisés .

Fonctionnalités du module complémentaire

Document Intelligence prend en charge les fonctionnalités facultatives que vous pouvez activer en fonction de votre scénario d’extraction :

Capacité Description
Extraction haute résolution Extrayez du texte à partir de documents haute résolution avec une plus grande précision.
Extraction de formule Détecter et extraire des formules mathématiques à partir de documents.
Extraction des propriétés de police Extrayez des informations de police telles que le style, l’épaisseur et la couleur.
Extraction de codes-barres Détecter et lire des codes-barres dans des documents.
PDF pouvant faire l’objet d’une recherche Convertissez des documents numérisés en fichiers PDF pouvant faire l’objet d’une recherche.
Champs de requête Utilisez des requêtes en langage naturel pour extraire des champs spécifiques de documents.
Paires clé-valeur Extrayez les relations de paire clé-valeur à partir de documents à l’aide du modèle de disposition.

Note

Certaines fonctionnalités d’extension sont des fonctionnalités Premium qui entraînent des coûts supplémentaires. Pour plus d’informations, consultez la page de tarification .

En savoir plus