Modèle de reçu Intelligence documentaire
Important
- Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif. Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
- La préversion publique des bibliothèques de client Intelligence documentaire utilise par défaut la version 2024-07-31-preview de l’API REST.
- La préversion publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes. Notez que le modèle génératif personnalisé (extraction de champ de document) dans AI Studio est disponible uniquement dans la région USA Centre Nord :
- USA Est
- USA Ouest 2
- Europe Ouest
- USA Centre Nord
Ce contenu s’applique à : v4.0 (préversion) | Versions précédentes : v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ce contenu s’applique à : v3.1 (GA) | Dernière version : v4.0 (préversion) | Versions précédentes : v3.0 v2.1
Ce contenu s’applique à : v3.0 (GA) | Dernières versions : v4.0 (préversion) v3.1 | Version précédente : v2.1
Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (préversion)
Le modèle de reçu Intelligence documentaire combine de puissantes capacités de reconnaissance optique de caractères (OCR) à des modèles de Deep Learning pour analyser et extraire des informations clés des reçus de ventes. Les reçus peuvent être de différents formats et qualités, y compris les reçus imprimés et manuscrits. L’API extrait des informations clés telles que le nom du commerçant, son numéro de téléphone, la date de la transaction, la taxe et le total de la transaction, et renvoie des données JSON structurées.
Types de reçus pris en charge :
- Thermique
- Carte de crédit
- Gaz
- Parking
- Hôtel
- Transport
- Communication
- Divertissement
- Vol
- Formation
- Pharmacie/Médecine
Extraction de données de reçu
La numérisation des reçus inclut la transformation de divers types de reçus, comme les copies numérisées, photographiées et imprimées, dans un format numérique pour simplifier le traitement en aval. Par exemple, la gestion des dépenses, l’analyse du comportement des consommateurs, l’automatisation fiscale, etc. L’utilisation d’Intelligence documentaire avec la technologie OCR (reconnaissance optique de caractères) permet d’extraire et d’interpréter des données de ces différents formats de reçus. Non seulement le traitement Intelligence documentaire simplifie le processus de conversion, mais il réduit aussi considérablement le temps et les efforts nécessaires, facilitant ainsi une gestion et une récupération efficaces des données.
Exemple de reçu traité à l’aide de Studio Intelligence documentaire :
Exemple d’un reçu traité avec l’outil d’Étiquetage des exemples d’Intelligence documentaire :
Options de développement
Intelligence documentaire v4.0 (2024-07-31-preview) prend en charge les outils, applications et bibliothèques suivants :
Fonctionnalité | Ressources | ID de modèle |
---|---|---|
Modèle de reçu | • Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript |
prebuilt-receipt |
Intelligence documentaire v3.1 prend en charge les outils, applications et bibliothèques suivants :
Fonction | Ressources | ID de modèle |
---|---|---|
Modèle de reçu | • Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript |
prebuilt-receipt |
Intelligence documentaire v3.0 prend en charge les outils, applications et bibliothèques suivants :
Fonction | Ressources | ID de modèle |
---|---|---|
Modèle de reçu | • Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript |
prebuilt-receipt |
Intelligence documentaire v2.1 prend en charge les outils, applications et bibliothèques suivants :
Fonction | Ressources |
---|---|
Modèle de reçu | ● Outil d’étiquetage Intelligence Documentaire • API REST • Kit de développement logiciel (SDK) Bibliothèque client • Intelligence Documentaire Conteneur Docker |
Critères des entrées
Formats de fichiers pris en charge :
Modèle PDF Image : JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office :
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLire ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Document général ✔ ✔ Prédéfinie ✔ ✔ Extraction personnalisée ✔ ✔ Classification personnalisée ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.
Pour les PDF et TIFF, jusqu'à 2 000 pages peuvent être traitées (avec un abonnement gratuit, seules les deux premières pages sont traitées).
La taille de fichier pour l’analyse de documents est de 500 Mo pour le niveau payant (S0) et de
4
Mo pour le niveau gratuit (F0).Les dimensions de l’image doivent être comprises entre 50 pixels x 50 pixels et 10 000 pixels x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.
La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond environ à un texte de
8
points à 150 points par pouce (ppp).Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.
Pour l’apprentissage du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle de gabarit et de
1
Go pour le modèle neuronal.Pour l’apprentissage du modèle de classification personnalisé, la taille totale des données d’entraînement est de
1
Go, avec un maximum de 10 000 pages. Pour 2024-07-31-preview et versions ultérieures, la taille totale des données d’apprentissage est de2
Go, avec un maximum de 10 000 pages.
- Formats de fichiers pris en charge : JPEG, PNG, PDF et TIFF.
- Prise en charge des pages pour PDF et TIFF : Intelligence documentaire peut traiter jusqu’à 2 000 pages pour les abonnés de niveau standard ou seulement les deux premières pages pour les abonnés de niveau gratuit.
- Taille de fichier prise en charge : moins de 50 Mo. Nombre de pixels minimum : 50 x 50 px. Nombre de pixels maximum : 10 000 x 10 000 px.
Extraction de données de modèle de reçu
Découvrez comment Intelligence documentaire extrait les données, comme l’heure et la date des transactions, les informations relatives aux commerçants et les montants totaux des reçus. Vous avez besoin des ressources suivantes :
Un abonnement Azure. Vous pouvez en créer un gratuitement.
Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (
F0
) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.
Remarque
Intelligence documentaire Studio est disponible avec les API v3.1 et v3.0 et versions ultérieures.
Dans la page d’accueil Document Intelligence Studio, sélectionnez Reçus.
Vous pouvez analyser l’exemple de reçu ou charger vos propres fichiers.
Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :
Outil d’étiquetage d’exemples d’Intelligence documentaire
Accédez à l’outil d’exemples Document Intelligence.
Dans la page d’accueil de l’outil d’étiquetage d’échantillon, sélectionnez la vignette Utiliser un modèle prédéfini pour obtenir des données.
Sélectionnez le Type de formulaire à analyser dans le menu déroulant.
Choisissez un URL pour le fichier que vous souhaitez analyser à partir des options ci-dessous :
Dans le champ Source, sélectionnez URL dans le menu déroulant, collez l’URL sélectionnée, puis sélectionnez le bouton Récupérer.
Dans le champ Point de terminaison du service Document Intelligence, collez le point de terminaison que vous avez obtenu avec votre abonnement Document Intelligence.
Dans le champ Clé, collez la clé que vous avez obtenue de votre ressource Document Intelligence.
Cliquez sur Exécuter l’analyse. L’outil d’étiquetage des exemples d’Intelligence Documentaire appelle l’API Analyze Prebuilt et analyse le document.
Afficher les résultats : consultez les paires clé-valeur extraites, les articles, le texte mis en évidence extrait et les tableaux détectés.
Notes
L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. Il s’agit d’une limite de l’outil et non du service d’Intelligence documentaire.
Langues et régions prises en charge
Pour obtenir la liste complète des langues prises en charge, consultez notre page Prise en charge des langues des modèles prédéfinis.
Extraction de champ
Nom | Type | Description | Sortie standardisée |
---|---|---|---|
ReceiptType | String | Type de reçu | Itemized |
MerchantName | String | Nom du commerçant émettant le reçu | |
MerchantPhoneNumber | phoneNumber | Numéro de téléphone de la liste de commerçants | +1 xxx xxx xxxx |
MerchantAddress | String | Adresse répertoriée du commerçant | |
TransactionDate | Date | Date d’émission du reçu | aaaa-mm-jj |
TransactionTime | Temps | Heure d’émission du reçu | hh-mm-ss (24 heures) |
Total | Nombre (USD) | Total du reçu | Virgule flottante à deux décimales |
Sous-total | Nombre (USD) | Sous-total du reçu, souvent avant application des taxes | Virgule flottante à deux décimales |
Taxe | Nombre (USD) | Total des taxes sur le reçu (TVA ou équivalent). Renommé « TotalTax » dans la version 2022-06-30. | Virgule flottante à deux décimales |
Conseil | Nombre (USD) | Pourboire inclus par l’acheteur | Virgule flottante à deux décimales |
Éléments | Tableau d’objets | Lignes extraites, avec le nom, la quantité, le prix unitaire et le prix total extraits | |
Nom | String | Description de l’élément. Renommé « Description » dans la version 2022-06-30. | |
Quantité | Number | Quantité de chaque élément | Virgule flottante à deux décimales |
Price | Number | Prix individuel de chaque unité d’article | Virgule flottante à deux décimales |
TotalPrice | Number | Prix total de la ligne de facturation | Virgule flottante à deux décimales |
Pour découvrir les champs d'extraction de documents pris en charge, reportez-vous à la page schéma du modèle de reçu dans notre référentiel d’exemples GitHub.
Guide de migration et API REST v3.1
- Suivez le guide de migration Intelligence documentaire v3.1 pour apprendre à utiliser la version 3.1 dans vos applications et workflows.
Étapes suivantes
Essayez de traiter vos propres formulaires et documents avec Document Intelligence Studio.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.
Essayez de traiter vos propres formulaires et documents avec l’outil d’étiquetage d’échantillons Intelligence Documentaire.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.