Modèle de reçu Intelligence documentaire

Article
10/20/2024

Important

Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif. Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
La préversion publique des bibliothèques de client Intelligence documentaire utilise par défaut la version 2024-07-31-preview de l’API REST.
La préversion publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes. Notez que le modèle génératif personnalisé (extraction de champ de document) dans AI Studio est disponible uniquement dans la région USA Centre Nord :
- USA Est
- USA Ouest 2
- Europe Ouest
- USA Centre Nord

Ce contenu s’applique à : v4.0 (préversion) | Versions précédentes : v3.1 (GA) v3.0 (GA) v2.1 (GA)

Ce contenu s’applique à : v3.1 (GA) | Dernière version : v4.0 (préversion) | Versions précédentes : v3.0 v2.1

Ce contenu s’applique à : v3.0 (GA) | Dernières versions : v4.0 (préversion) v3.1 | Version précédente : v2.1

Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (préversion)

Le modèle de reçu Intelligence documentaire combine de puissantes capacités de reconnaissance optique de caractères (OCR) à des modèles de Deep Learning pour analyser et extraire des informations clés des reçus de ventes. Les reçus peuvent être de différents formats et qualités, y compris les reçus imprimés et manuscrits. L’API extrait des informations clés telles que le nom du commerçant, son numéro de téléphone, la date de la transaction, la taxe et le total de la transaction, et renvoie des données JSON structurées.

Types de reçus pris en charge :

Thermique
Carte de crédit
Gaz
Parking
Hôtel
Transport
Communication
Divertissement
Vol
Formation
Pharmacie/Médecine

Extraction de données de reçu

La numérisation des reçus inclut la transformation de divers types de reçus, comme les copies numérisées, photographiées et imprimées, dans un format numérique pour simplifier le traitement en aval. Par exemple, la gestion des dépenses, l’analyse du comportement des consommateurs, l’automatisation fiscale, etc. L’utilisation d’Intelligence documentaire avec la technologie OCR (reconnaissance optique de caractères) permet d’extraire et d’interpréter des données de ces différents formats de reçus. Non seulement le traitement Intelligence documentaire simplifie le processus de conversion, mais il réduit aussi considérablement le temps et les efforts nécessaires, facilitant ainsi une gestion et une récupération efficaces des données.

Exemple de reçu traité à l’aide de Studio Intelligence documentaire :

Exemple d’un reçu traité avec l’outil d’Étiquetage des exemples d’Intelligence documentaire :

Capture d’écran d’un exemple de reçu traité avec l’outil d’étiquetage des exemples Form Recognizer.

Options de développement

Intelligence documentaire v4.0 (2024-07-31-preview) prend en charge les outils, applications et bibliothèques suivants :

Fonctionnalité	Ressources	ID de modèle
Modèle de reçu	• Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript	prebuilt-receipt

Intelligence documentaire v3.1 prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources	ID de modèle
Modèle de reçu	• Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript	prebuilt-receipt

Intelligence documentaire v3.0 prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources	ID de modèle
Modèle de reçu	• Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript	prebuilt-receipt

Intelligence documentaire v2.1 prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources
Modèle de reçu	● Outil d’étiquetage Intelligence Documentaire • API REST • Kit de développement logiciel (SDK) Bibliothèque client • Intelligence Documentaire Conteneur Docker

Critères des entrées

Formats de fichiers pris en charge :

Modèle	PDF	Image : `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office : Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Lire	✔	✔	✔
Layout	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
Document général	✔	✔
Prédéfinie	✔	✔
Extraction personnalisée	✔	✔
Classification personnalisée	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview)

Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.
Pour les PDF et TIFF, jusqu'à 2 000 pages peuvent être traitées (avec un abonnement gratuit, seules les deux premières pages sont traitées).
La taille de fichier pour l’analyse de documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
Les dimensions de l’image doivent être comprises entre 50 pixels x 50 pixels et 10 000 pixels x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.
La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond environ à un texte de 8 points à 150 points par pouce (ppp).
Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.
- Pour l’apprentissage du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle de gabarit et de 1 Go pour le modèle neuronal.
- Pour l’apprentissage du modèle de classification personnalisé, la taille totale des données d’entraînement est de 1 Go, avec un maximum de 10 000 pages. Pour 2024-07-31-preview et versions ultérieures, la taille totale des données d’apprentissage est de 2 Go, avec un maximum de 10 000 pages.

Formats de fichiers pris en charge : JPEG, PNG, PDF et TIFF.
Prise en charge des pages pour PDF et TIFF : Intelligence documentaire peut traiter jusqu’à 2 000 pages pour les abonnés de niveau standard ou seulement les deux premières pages pour les abonnés de niveau gratuit.
Taille de fichier prise en charge : moins de 50 Mo. Nombre de pixels minimum : 50 x 50 px. Nombre de pixels maximum : 10 000 x 10 000 px.

Extraction de données de modèle de reçu

Découvrez comment Intelligence documentaire extrait les données, comme l’heure et la date des transactions, les informations relatives aux commerçants et les montants totaux des reçus. Vous avez besoin des ressources suivantes :

Un abonnement Azure. Vous pouvez en créer un gratuitement.
Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.

Capture d’écran de l’emplacement des clés et des points de terminaison dans le Portail Azure.

Remarque

Intelligence documentaire Studio est disponible avec les API v3.1 et v3.0 et versions ultérieures.

Dans la page d’accueil Document Intelligence Studio, sélectionnez Reçus.
Vous pouvez analyser l’exemple de reçu ou charger vos propres fichiers.
Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :

Essayer Document Intelligence Studio.

Outil d’étiquetage d’exemples d’Intelligence documentaire

Accédez à l’outil d’exemples Document Intelligence.
Dans la page d’accueil de l’outil d’étiquetage d’échantillon, sélectionnez la vignette Utiliser un modèle prédéfini pour obtenir des données.
Sélectionnez le Type de formulaire à analyser dans le menu déroulant.
Choisissez un URL pour le fichier que vous souhaitez analyser à partir des options ci-dessous :
Dans le champ Source, sélectionnez URL dans le menu déroulant, collez l’URL sélectionnée, puis sélectionnez le bouton Récupérer.
Dans le champ Point de terminaison du service Document Intelligence, collez le point de terminaison que vous avez obtenu avec votre abonnement Document Intelligence.
Dans le champ Clé, collez la clé que vous avez obtenue de votre ressource Document Intelligence.
Cliquez sur Exécuter l’analyse. L’outil d’étiquetage des exemples d’Intelligence Documentaire appelle l’API Analyze Prebuilt et analyse le document.
Afficher les résultats : consultez les paires clé-valeur extraites, les articles, le texte mis en évidence extrait et les tableaux détectés.

Notes

L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. Il s’agit d’une limite de l’outil et non du service d’Intelligence documentaire.

Langues et régions prises en charge

Pour obtenir la liste complète des langues prises en charge, consultez notre page Prise en charge des langues des modèles prédéfinis.

Extraction de champ

Nom	Type	Description	Sortie standardisée
ReceiptType	String	Type de reçu	Itemized
MerchantName	String	Nom du commerçant émettant le reçu
MerchantPhoneNumber	phoneNumber	Numéro de téléphone de la liste de commerçants	+1 xxx xxx xxxx
MerchantAddress	String	Adresse répertoriée du commerçant
TransactionDate	Date	Date d’émission du reçu	aaaa-mm-jj
TransactionTime	Temps	Heure d’émission du reçu	hh-mm-ss (24 heures)
Total	Nombre (USD)	Total du reçu	Virgule flottante à deux décimales
Sous-total	Nombre (USD)	Sous-total du reçu, souvent avant application des taxes	Virgule flottante à deux décimales
Taxe	Nombre (USD)	Total des taxes sur le reçu (TVA ou équivalent). Renommé « TotalTax » dans la version 2022-06-30.	Virgule flottante à deux décimales
Conseil	Nombre (USD)	Pourboire inclus par l’acheteur	Virgule flottante à deux décimales
Éléments	Tableau d’objets	Lignes extraites, avec le nom, la quantité, le prix unitaire et le prix total extraits
Nom	String	Description de l’élément. Renommé « Description » dans la version 2022-06-30.
Quantité	Number	Quantité de chaque élément	Virgule flottante à deux décimales
Price	Number	Prix individuel de chaque unité d’article	Virgule flottante à deux décimales
TotalPrice	Number	Prix total de la ligne de facturation	Virgule flottante à deux décimales

Pour découvrir les champs d'extraction de documents pris en charge, reportez-vous à la page schéma du modèle de reçu dans notre référentiel d’exemples GitHub.

Guide de migration et API REST v3.1

Suivez le guide de migration Intelligence documentaire v3.1 pour apprendre à utiliser la version 3.1 dans vos applications et workflows.

Étapes suivantes

Essayez de traiter vos propres formulaires et documents avec Document Intelligence Studio.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.

Découvrez plus d’exemples sur GitHub.

Découvrez plus d’exemples sur GitHub.

Essayez de traiter vos propres formulaires et documents avec l’outil d’étiquetage d’échantillons Intelligence Documentaire.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.

Partage via