Modèle de reçu Intelligence documentaire

Important

  • Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif.
  • Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
  • La version d'aperçu publique des bibliothèques clientes Document Intelligence est par défaut la version 2024-02-29-preview de l'API REST.
  • La version d’évaluation publique 2024-02-29-preview est actuellement disponible uniquement dans les régions Azure suivantes :
  • USA Est
  • USA Ouest 2
  • Europe Ouest

Ce contenu s’applique à :cochev4.0 (préversion) | Versions précédentes :coche-bleuev3.1(GA)coche-bleuev3.0 (GA)coche-bleuev2.1 (GA)

Ce contenu s’applique à :cochev3.1 (GA) | Dernière version :coche violettev4.0 (préversion) | Versions précédentes :coche-bleuev3.0coche-bleuev2.1

Ce contenu s’applique à :cochev3.0 (GA) | Dernières versions :coche violettev4.0 (préversion)coche-violettev3.1 | Version précédente :coche-bleuev2.1

Ce contenu s’applique à :cochev2.1 | Dernière version :Coche bleuev4.0 (préversion)

Le modèle de reçu Intelligence documentaire combine de puissantes capacités de reconnaissance optique de caractères (OCR) à des modèles de Deep Learning pour analyser et extraire des informations clés des reçus de ventes. Les reçus peuvent être de différents formats et qualités, y compris les reçus imprimés et manuscrits. L’API extrait des informations clés telles que le nom du commerçant, son numéro de téléphone, la date de la transaction, la taxe et le total de la transaction, et renvoie des données JSON structurées.

Types de reçus pris en charge :

  • Thermique
  • Carte de crédit
  • Gaz
  • Parking
  • Hôtel
  • Transport
  • Communication
  • Divertissement
  • Vol
  • Formation
  • Pharmacie/Médecine

Extraction de données de reçu

La numérisation des reçus inclut la transformation de divers types de reçus, comme les copies numérisées, photographiées et imprimées, dans un format numérique pour simplifier le traitement en aval. Par exemple, la gestion des dépenses, l’analyse du comportement des consommateurs, l’automatisation fiscale, etc. L’utilisation d’Intelligence documentaire avec la technologie OCR (reconnaissance optique de caractères) permet d’extraire et d’interpréter des données de ces différents formats de reçus. Non seulement le traitement Intelligence documentaire simplifie le processus de conversion, mais il réduit aussi considérablement le temps et les efforts nécessaires, facilitant ainsi une gestion et une récupération efficaces des données.

Exemple de reçu traité à l’aide de Studio Intelligence documentaire :

Capture d’écran d’un exemple de reçu dans le studio Intelligence documentaire.

Exemple d’un reçu traité avec l’outil d’Étiquetage des exemples d’Intelligence documentaire :

Capture d’écran d’un exemple de reçu traité avec l’outil d’étiquetage des exemples Form Recognizer.

Options de développement

Intelligence documentaire v4.0 (2024-02-29-preview, 2023-10-31-preview) prend en charge les applications, les bibliothèques et les outils suivants :

Fonctionnalité Ressources ID de modèle
Modèle de reçu Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-receipt

Intelligence documentaire v3.1 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources ID de modèle
Modèle de reçu Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-receipt

Intelligence documentaire v3.0 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources ID de modèle
Modèle de reçu Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-receipt

Intelligence documentaire v2.1 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources
Modèle de reçu ● Outil d’étiquetage Intelligence Documentaire
API REST
Kit de développement logiciel (SDK) Bibliothèque client
Intelligence Documentaire Conteneur Docker

Critères des entrées

  • Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.

  • Formats de fichiers pris en charge :

    Modèle PDF Image :
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office :
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) et HTML
    Lire
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Document général
    Prédéfinie
    Extraction personnalisée
    Classification personnalisée ✔ (2024-02-29-preview)
  • Pour PDF et TIFF, il est possible de traiter jusqu’à 2 000 pages (avec un abonnement gratuit, seules les deux premières pages sont traitées).

  • La taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).

  • Les dimensions des images doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.

  • Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.

  • La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce (PPP).

  • Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.

    • Pour l’entraînement du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle et 1G-Mo pour le modèle neural.

    • Pour l’entraînement du modèle de classification personnalisée, la taille totale des données de formation est 1GB, avec un maximum à 10 000 pages.

  • Formats de fichiers pris en charge : JPEG, PNG, PDF et TIFF.
  • Prise en charge des pages pour PDF et TIFF : Intelligence documentaire peut traiter jusqu’à 2 000 pages pour les abonnés de niveau standard ou seulement les deux premières pages pour les abonnés de niveau gratuit.
  • Taille de fichier prise en charge : moins de 50 Mo. Nombre de pixels minimum : 50 x 50 px. Nombre de pixels maximum : 10 000 x 10 000 px.

Extraction de données de modèle de reçu

Découvrez comment Intelligence documentaire extrait les données, comme l’heure et la date des transactions, les informations relatives aux commerçants et les montants totaux des reçus. Vous avez besoin des ressources suivantes :

  • Un abonnement Azure. Vous pouvez en créer un gratuitement.

  • Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.

Capture d’écran de l’emplacement des clés et des points de terminaison dans le Portail Azure.

Remarque

Intelligence documentaire Studio est disponible avec les API v3.1 et v3.0 et versions ultérieures.

  1. Dans la page d’accueil Document Intelligence Studio, sélectionnez Reçus.

  2. Vous pouvez analyser l’exemple de reçu ou charger vos propres fichiers.

  3. Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :

    Capture d’écran des boutons Exécuter l’analyse et Options d’analyse dans Document Intelligence Studio.

Outil d’étiquetage d’exemples d’Intelligence documentaire

  1. Accédez à l’outil d’exemples Document Intelligence.

  2. Dans la page d’accueil de l’outil d’étiquetage d’échantillon, sélectionnez la vignette Utiliser un modèle prédéfini pour obtenir des données.

    Capture d’écran du processus d’analyse des résultats du modèle de disposition.

  3. Sélectionnez le Type de formulaire à analyser dans le menu déroulant.

  4. Choisissez un URL pour le fichier que vous souhaitez analyser à partir des options ci-dessous :

  5. Dans le champ Source, sélectionnez URL dans le menu déroulant, collez l’URL sélectionnée, puis sélectionnez le bouton Récupérer.

    Capture d'écran du menu déroulant de l'emplacement de la source.

  6. Dans le champ Point de terminaison du service Document Intelligence, collez le point de terminaison que vous avez obtenu avec votre abonnement Document Intelligence.

  7. Dans le champ Clé, collez la clé que vous avez obtenue de votre ressource Document Intelligence.

    Capture d’écran du menu déroulant pour sélectionner un type de formulaire.

  8. Cliquez sur Exécuter l’analyse. L’outil d’étiquetage des exemples d’Intelligence Documentaire appelle l’API Analyze Prebuilt et analyse le document.

  9. Afficher les résultats : consultez les paires clé-valeur extraites, les articles, le texte mis en évidence extrait et les tableaux détectés.

    Capture d’écran de l’opération des résultats d’analyse du modèle de disposition.

Notes

L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. Il s’agit d’une limite de l’outil et non du service d’Intelligence documentaire.

Langues et régions prises en charge

Pour obtenir la liste complète des langues prises en charge, consultez notre page Prise en charge des langues : Modèles prédéfinis.

Extraction de champ

Nom Type Description Sortie standardisée
ReceiptType String Type de reçu Itemized
MerchantName String Nom du commerçant émettant le reçu
MerchantPhoneNumber phoneNumber Numéro de téléphone de la liste de commerçants +1 xxx xxx xxxx
MerchantAddress String Adresse répertoriée du commerçant
TransactionDate Date Date d’émission du reçu aaaa-mm-jj
TransactionTime Temps Heure d’émission du reçu hh-mm-ss (24 heures)
Total Nombre (USD) Total du reçu Virgule flottante à deux décimales
Sous-total Nombre (USD) Sous-total du reçu, souvent avant application des taxes Virgule flottante à deux décimales
Taxe Nombre (USD) Total des taxes sur le reçu (TVA ou équivalent). Renommé « TotalTax » dans la version 2022-06-30. Virgule flottante à deux décimales
Conseil Nombre (USD) Pourboire inclus par l’acheteur Virgule flottante à deux décimales
Éléments Tableau d’objets Lignes extraites, avec le nom, la quantité, le prix unitaire et le prix total extraits
Nom String Description de l’élément. Renommé « Description » dans la version 2022-06-30.
Quantité Number Quantité de chaque élément Virgule flottante à deux décimales
Price Number Prix individuel de chaque unité d’article Virgule flottante à deux décimales
TotalPrice Number Prix total de la ligne de facturation Virgule flottante à deux décimales

Intelligence documentaire v3.0 et versions ultérieures introduisent plusieurs nouvelles fonctionnalités et capacités. En plus des reçus thermiques, le modèle Reçu prend en charge le traitement des reçus d’hôtel à page unique et l’extraction des détails fiscaux pour tous les types de reçus.

Intelligence documentaire v4.0 et versions ultérieures introduit la prise en charge de la monnaie locale pour tous les champs de prix des reçus de thermes et d’hôtel.

Reçu

Champ Type Description Exemple
MerchantName string Nom du commerçant émettant le reçu Contoso
MerchantPhoneNumber phoneNumber Numéro de téléphone de la liste de commerçants 987-654-3210
MerchantAddress address Adresse répertoriée du commerçant 123 Main St. Redmond, Washington 98052
Total number Total du reçu $14.34
TransactionDate date Date d’émission du reçu 06 juin 2019
TransactionTime time Heure d’émission du reçu 4:49 PM
Subtotal number Sous-total du reçu, souvent avant application des taxes $12.34
TotalTax number Taxe sur le reçu, TVA ou équivalent $2.00
Tip number Pourboire inclus par l’acheteur $1.00
Items array
Items.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Prix total de la ligne de facturation $999.00
Items.*.Description string Description de l’élément Surface Pro 6
Items.*.Quantity number Quantité de chaque élément 1
Items.*.Price number Prix individuel de chaque unité d’article $999.00
Items.*.ProductCode string Code du produit, numéro de produit ou référence SKU associé à l’élément de ligne spécifique A123
Items.*.QuantityUnit string Unité de quantité de chaque élément
TaxDetails array
TaxDetails.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Le montant du détail des taxes $999.00

receipt.retailMeal

Champ Type Description Exemple
MerchantName string Nom du commerçant émettant le reçu Contoso
MerchantPhoneNumber phoneNumber Numéro de téléphone de la liste de commerçants 987-654-3210
MerchantAddress address Adresse répertoriée du commerçant 123 Main St. Redmond, Washington 98052
Total number Total du reçu $14.34
TransactionDate date Date d’émission du reçu 06 juin 2019
TransactionTime time Heure d’émission du reçu 4:49 PM
Subtotal number Sous-total du reçu, souvent avant application des taxes $12.34
TotalTax number Taxe sur le reçu, TVA ou équivalent $2.00
Tip number Pourboire inclus par l’acheteur $1.00
Items array
Items.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Prix total de la ligne de facturation $999.00
Items.*.Description string Description de l’élément Surface Pro 6
Items.*.Quantity number Quantité de chaque élément 1
Items.*.Price number Prix individuel de chaque unité d’article $999.00
Items.*.ProductCode string Code du produit, numéro de produit ou référence SKU associé à l’élément de ligne spécifique A123
Items.*.QuantityUnit string Unité de quantité de chaque élément
TaxDetails array
TaxDetails.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Le montant du détail des taxes $999.00

receipt.creditCard

Champ Type Description Exemple
MerchantName string Nom du commerçant émettant le reçu Contoso
MerchantPhoneNumber phoneNumber Numéro de téléphone de la liste de commerçants 987-654-3210
MerchantAddress address Adresse répertoriée du commerçant 123 Main St. Redmond, Washington 98052
Total number Total du reçu $14.34
TransactionDate date Date d’émission du reçu 06 juin 2019
TransactionTime time Heure d’émission du reçu 4:49 PM
Subtotal number Sous-total du reçu, souvent avant application des taxes $12.34
TotalTax number Taxe sur le reçu, TVA ou équivalent $2.00
Tip number Pourboire inclus par l’acheteur $1.00
Items array
Items.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Prix total de la ligne de facturation $999.00
Items.*.Description string Description de l’élément Surface Pro 6
Items.*.Quantity number Quantité de chaque élément 1
Items.*.Price number Prix individuel de chaque unité d’article $999.00
Items.*.ProductCode string Code du produit, numéro de produit ou référence SKU associé à l’élément de ligne spécifique A123
Items.*.QuantityUnit string Unité de quantité de chaque élément
TaxDetails array
TaxDetails.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Le montant du détail des taxes $999.00

receipt.gas

Champ Type Description Exemple
MerchantName string Nom du commerçant émettant le reçu Contoso
MerchantPhoneNumber phoneNumber Numéro de téléphone de la liste de commerçants 987-654-3210
MerchantAddress address Adresse répertoriée du commerçant 123 Main St. Redmond, Washington 98052
Total number Total du reçu $14.34
TransactionDate date Date d’émission du reçu 06 juin 2019
TransactionTime time Heure d’émission du reçu 4:49 PM
Subtotal number Sous-total du reçu, souvent avant application des taxes $12.34
TotalTax number Taxe sur le reçu, TVA ou équivalent $2.00
Tip number Pourboire inclus par l’acheteur $1.00
Items array
Items.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Prix total de la ligne de facturation $999.00
Items.*.Description string Description de l’élément Surface Pro 6
Items.*.Quantity number Quantité de chaque élément 1
Items.*.Price number Prix individuel de chaque unité d’article $999.00
Items.*.ProductCode string Code du produit, numéro de produit ou référence SKU associé à l’élément de ligne spécifique A123
Items.*.QuantityUnit string Unité de quantité de chaque élément
TaxDetails array
TaxDetails.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Le montant du détail des taxes $999.00

receipt.parking

Champ Type Description Exemple
MerchantName string Nom du commerçant émettant le reçu Contoso
MerchantPhoneNumber phoneNumber Numéro de téléphone de la liste de commerçants 987-654-3210
MerchantAddress address Adresse répertoriée du commerçant 123 Main St. Redmond, Washington 98052
Total number Total du reçu $14.34
TransactionDate date Date d’émission du reçu 06 juin 2019
TransactionTime time Heure d’émission du reçu 4:49 PM
Subtotal number Sous-total du reçu, souvent avant application des taxes $12.34
TotalTax number Taxe sur le reçu, TVA ou équivalent $2.00
Tip number Pourboire inclus par l’acheteur $1.00
Items array
Items.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Prix total de la ligne de facturation $999.00
Items.*.Description string Description de l’élément Surface Pro 6
Items.*.Quantity number Quantité de chaque élément 1
Items.*.Price number Prix individuel de chaque unité d’article $999.00
Items.*.ProductCode string Code du produit, numéro de produit ou référence SKU associé à l’élément de ligne spécifique A123
Items.*.QuantityUnit string Unité de quantité de chaque élément
TaxDetails array
TaxDetails.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Le montant du détail des taxes $999.00

receipt.hotel

Champ Type Description Exemple
MerchantName string Nom du commerçant émettant le reçu Contoso
MerchantPhoneNumber phoneNumber Numéro de téléphone de la liste de commerçants 987-654-310
MerchantAddress address Adresse répertoriée du commerçant 123 Main St. Redmond, Washington 98052
Total number Total du reçu $14.34
ArrivalDate date Date d’arrivée 27Mar21
DepartureDate date Date de départ 28Mar21
Currency string Unité monétaire des montants de reçu (ISO 4217) ou « MIXED » si plusieurs valeurs sont trouvées USD
MerchantAliases array
MerchantAliases.* string Autre nom du commerçant Contoso (R)
Items array
Items.* object Élément de ligne extrait 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Prix total de la ligne de facturation $999.00
Items.*.Description string Description de l’élément Frais de chambre
Items.*.Date date Date de l’élément 27Mar21
Items.*.Category string Catégorie d’élément Salle

Guide de migration et API REST v3.1

Étapes suivantes