Utiliser Document Intelligence Studio
Tip
Pour plus d’informations, consultez l’onglet Texte et images !
Azure Document Intelligence Studio est un outil en ligne permettant d’explorer, de comprendre et d’intégrer visuellement les fonctionnalités du service Document Intelligence. Vous pouvez utiliser Studio pour analyser les dispositions de formulaire, extraire des données à partir de modèles prédéfinis et entraîner des modèles personnalisés, tout au long d’une interface visuelle.
Vous pouvez accéder à Studio à documentintelligence.ai.azure.com.
Fonctionnalités de Studio
Document Intelligence Studio prend en charge les types de projets suivants :
Modèles d’analyse de documents : testez les modèles de lecture et de disposition sur vos propres documents pour voir le texte extrait, les tableaux et la structure.
Modèles prédéfinis : analysez les documents à l’aide de n’importe quel modèle prédéfini disponible, comme les factures, les reçus, les documents d’ID et les formulaires fiscaux disponibles.
Modèles personnalisés : Générer, étiqueter, entraîner et tester des modèles d’extraction personnalisés et des classifieurs personnalisés.
Analyser des documents avec des modèles prédéfinis
Pour extraire des données de documents à l’aide de modèles prédéfinis dans Studio :
- Créez une ressource Azure Document Intelligence ou Foundry Tools dans le portail Azure.
- Ouvrez Document Intelligence Studio et sélectionnez un modèle prédéfini (par exemple, Facture, Reçu ou Document d’ID).
- Fournissez votre point de terminaison de ressource et votre clé.
- Chargez ou fournissez une URL vers le document que vous souhaitez analyser.
- Passez en revue les champs extraits et leurs scores de confiance.
Créer des projets de modèle personnalisé
Vous pouvez utiliser Studio pour gérer l’ensemble du processus d’étiquetage, d’entraînement et de test de modèles personnalisés, sans créer manuellement de fichiers JSON. Le Studio génère automatiquement les fichiers ocr.json, labels.json et fields.json requis.
Le flux de travail de haut niveau est le suivant :
- Créez une ressource Azure Document Intelligence ou Foundry.
- Chargez au moins 5 à 6 exemples de formulaires dans un conteneur Stockage Blob Azure.
- Configurez le partage de ressources inter-origines (CORS) afin que Studio puisse accéder à votre conteneur de stockage.
- Créez un projet de modèle personnalisé dans Studio, en liant votre conteneur de stockage et votre ressource Document Intelligence.
- Étiqueter des champs dans vos exemples de documents à l’aide de l’interface visuelle de Studio.
- Entraîner votre modèle et passer en revue les métriques de précision.
- Testez le modèle sur un nouveau document qui n’a pas été utilisé pendant l’entraînement.
Vous en apprendrez davantage sur les types de modèles personnalisés et le flux de travail d’entraînement de l’API REST/sdk de remplacement dans l’unité Entraîner et utiliser des modèles personnalisés .
Fonctionnalités du module complémentaire
Document Intelligence prend en charge les fonctionnalités facultatives que vous pouvez activer en fonction de votre scénario d’extraction :
| Capacité | Description |
|---|---|
| Extraction haute résolution | Extrayez du texte à partir de documents haute résolution avec une plus grande précision. |
| Extraction de formule | Détecter et extraire des formules mathématiques à partir de documents. |
| Extraction des propriétés de police | Extrayez des informations de police telles que le style, l’épaisseur et la couleur. |
| Extraction de codes-barres | Détecter et lire des codes-barres dans des documents. |
| PDF pouvant faire l’objet d’une recherche | Convertissez des documents numérisés en fichiers PDF pouvant faire l’objet d’une recherche. |
| Champs de requête | Utilisez des requêtes en langage naturel pour extraire des champs spécifiques de documents. |
| Paires clé-valeur | Extrayez les relations de paire clé-valeur à partir de documents à l’aide du modèle de disposition. |
Note
Certaines fonctionnalités d’extension sont des fonctionnalités Premium qui entraînent des coûts supplémentaires. Pour plus d’informations, consultez la page de tarification .