Partage via


Modèle de reçu Intelligence documentaire

Important

  • Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif. Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
  • La préversion publique des bibliothèques de client Intelligence documentaire utilise par défaut la version 2024-07-31-preview de l’API REST.
  • La préversion publique 2024-07-31-preview est actuellement disponible uniquement dans les régions Azure suivantes. Notez que le modèle génératif personnalisé (extraction de champ de document) dans AI Studio est disponible uniquement dans la région USA Centre Nord :
    • USA Est
    • USA Ouest 2
    • Europe Ouest
    • USA Centre Nord 

Ce contenu s’applique à : coche v4.0 (préversion) | Versions précédentes : coche-bleue v3.1 (GA) coche-bleue v3.0 (GA) coche-bleue v2.1 (GA)

Ce contenu s’applique à : coche v3.1 (GA) | Dernière version : coche violette v4.0 (préversion) | Versions précédentes : coche-bleue v3.0 coche-bleue v2.1

Ce contenu s’applique à : coche v3.0 (GA) | Dernières versions : coche violette v4.0 (préversion) coche-violette v3.1 | Version précédente : coche-bleue v2.1

Ce contenu s’applique à : coche v2.1 | Dernière version : Coche bleue v4.0 (préversion)

Le modèle de reçu Intelligence documentaire combine de puissantes capacités de reconnaissance optique de caractères (OCR) à des modèles de Deep Learning pour analyser et extraire des informations clés des reçus de ventes. Les reçus peuvent être de différents formats et qualités, y compris les reçus imprimés et manuscrits. L’API extrait des informations clés telles que le nom du commerçant, son numéro de téléphone, la date de la transaction, la taxe et le total de la transaction, et renvoie des données JSON structurées.

Types de reçus pris en charge :

  • Thermique
  • Carte de crédit
  • Gaz
  • Parking
  • Hôtel
  • Transport
  • Communication
  • Divertissement
  • Vol
  • Formation
  • Pharmacie/Médecine

Extraction de données de reçu

La numérisation des reçus inclut la transformation de divers types de reçus, comme les copies numérisées, photographiées et imprimées, dans un format numérique pour simplifier le traitement en aval. Par exemple, la gestion des dépenses, l’analyse du comportement des consommateurs, l’automatisation fiscale, etc. L’utilisation d’Intelligence documentaire avec la technologie OCR (reconnaissance optique de caractères) permet d’extraire et d’interpréter des données de ces différents formats de reçus. Non seulement le traitement Intelligence documentaire simplifie le processus de conversion, mais il réduit aussi considérablement le temps et les efforts nécessaires, facilitant ainsi une gestion et une récupération efficaces des données.

Exemple de reçu traité à l’aide de Studio Intelligence documentaire :

Capture d’écran d’un exemple de reçu dans le studio Intelligence documentaire.

Exemple d’un reçu traité avec l’outil d’Étiquetage des exemples d’Intelligence documentaire :

Capture d’écran d’un exemple de reçu traité avec l’outil d’étiquetage des exemples Form Recognizer.

Options de développement

Intelligence documentaire v4.0 (2024-07-31-preview) prend en charge les outils, applications et bibliothèques suivants :

Fonctionnalité Ressources ID de modèle
Modèle de reçu Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-receipt

Intelligence documentaire v3.1 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources ID de modèle
Modèle de reçu Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-receipt

Intelligence documentaire v3.0 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources ID de modèle
Modèle de reçu Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-receipt

Intelligence documentaire v2.1 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources
Modèle de reçu ● Outil d’étiquetage Intelligence Documentaire
API REST
Kit de développement logiciel (SDK) Bibliothèque client
Intelligence Documentaire Conteneur Docker

Critères des entrées

  • Formats de fichiers pris en charge :

    Modèle PDF Image :
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office :
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lire
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Document général
    Prédéfinie
    Extraction personnalisée
    Classification personnalisée ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.

  • Pour les PDF et TIFF, jusqu'à 2 000 pages peuvent être traitées (avec un abonnement gratuit, seules les deux premières pages sont traitées).

  • La taille de fichier pour l’analyse de documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).

  • Les dimensions de l’image doivent être comprises entre 50 pixels x 50 pixels et 10 000 pixels x 10 000 pixels.

  • Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.

  • La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond environ à un texte de 8 points à 150 points par pouce (ppp).

  • Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.

    • Pour l’apprentissage du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle de gabarit et de 1 Go pour le modèle neuronal.

    • Pour l’apprentissage du modèle de classification personnalisé, la taille totale des données d’entraînement est de 1 Go, avec un maximum de 10 000 pages. Pour 2024-07-31-preview et versions ultérieures, la taille totale des données d’apprentissage est de 2 Go, avec un maximum de 10 000 pages.

  • Formats de fichiers pris en charge : JPEG, PNG, PDF et TIFF.
  • Prise en charge des pages pour PDF et TIFF : Intelligence documentaire peut traiter jusqu’à 2 000 pages pour les abonnés de niveau standard ou seulement les deux premières pages pour les abonnés de niveau gratuit.
  • Taille de fichier prise en charge : moins de 50 Mo. Nombre de pixels minimum : 50 x 50 px. Nombre de pixels maximum : 10 000 x 10 000 px.

Extraction de données de modèle de reçu

Découvrez comment Intelligence documentaire extrait les données, comme l’heure et la date des transactions, les informations relatives aux commerçants et les montants totaux des reçus. Vous avez besoin des ressources suivantes :

  • Un abonnement Azure. Vous pouvez en créer un gratuitement.

  • Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.

Capture d’écran de l’emplacement des clés et des points de terminaison dans le Portail Azure.

Remarque

Intelligence documentaire Studio est disponible avec les API v3.1 et v3.0 et versions ultérieures.

  1. Dans la page d’accueil Document Intelligence Studio, sélectionnez Reçus.

  2. Vous pouvez analyser l’exemple de reçu ou charger vos propres fichiers.

  3. Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :

    Capture d’écran des boutons Exécuter l’analyse et Options d’analyse dans Document Intelligence Studio.

Outil d’étiquetage d’exemples d’Intelligence documentaire

  1. Accédez à l’outil d’exemples Document Intelligence.

  2. Dans la page d’accueil de l’outil d’étiquetage d’échantillon, sélectionnez la vignette Utiliser un modèle prédéfini pour obtenir des données.

    Capture d’écran du processus d’analyse des résultats du modèle de disposition.

  3. Sélectionnez le Type de formulaire à analyser dans le menu déroulant.

  4. Choisissez un URL pour le fichier que vous souhaitez analyser à partir des options ci-dessous :

  5. Dans le champ Source, sélectionnez URL dans le menu déroulant, collez l’URL sélectionnée, puis sélectionnez le bouton Récupérer.

    Capture d'écran du menu déroulant de l'emplacement de la source.

  6. Dans le champ Point de terminaison du service Document Intelligence, collez le point de terminaison que vous avez obtenu avec votre abonnement Document Intelligence.

  7. Dans le champ Clé, collez la clé que vous avez obtenue de votre ressource Document Intelligence.

    Capture d’écran du menu déroulant pour sélectionner un type de formulaire.

  8. Cliquez sur Exécuter l’analyse. L’outil d’étiquetage des exemples d’Intelligence Documentaire appelle l’API Analyze Prebuilt et analyse le document.

  9. Afficher les résultats : consultez les paires clé-valeur extraites, les articles, le texte mis en évidence extrait et les tableaux détectés.

    Capture d’écran de l’opération des résultats d’analyse du modèle de disposition.

Notes

L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. Il s’agit d’une limite de l’outil et non du service d’Intelligence documentaire.

Langues et régions prises en charge

Pour obtenir la liste complète des langues prises en charge, consultez notre page Prise en charge des langues des modèles prédéfinis.

Extraction de champ

Nom Type Description Sortie standardisée
ReceiptType String Type de reçu Itemized
MerchantName String Nom du commerçant émettant le reçu
MerchantPhoneNumber phoneNumber Numéro de téléphone de la liste de commerçants +1 xxx xxx xxxx
MerchantAddress String Adresse répertoriée du commerçant
TransactionDate Date Date d’émission du reçu aaaa-mm-jj
TransactionTime Temps Heure d’émission du reçu hh-mm-ss (24 heures)
Total Nombre (USD) Total du reçu Virgule flottante à deux décimales
Sous-total Nombre (USD) Sous-total du reçu, souvent avant application des taxes Virgule flottante à deux décimales
Taxe Nombre (USD) Total des taxes sur le reçu (TVA ou équivalent). Renommé « TotalTax » dans la version 2022-06-30. Virgule flottante à deux décimales
Conseil Nombre (USD) Pourboire inclus par l’acheteur Virgule flottante à deux décimales
Éléments Tableau d’objets Lignes extraites, avec le nom, la quantité, le prix unitaire et le prix total extraits
Nom String Description de l’élément. Renommé « Description » dans la version 2022-06-30.
Quantité Number Quantité de chaque élément Virgule flottante à deux décimales
Price Number Prix individuel de chaque unité d’article Virgule flottante à deux décimales
TotalPrice Number Prix total de la ligne de facturation Virgule flottante à deux décimales

Pour découvrir les champs d'extraction de documents pris en charge, reportez-vous à la page schéma du modèle de reçu dans notre référentiel d’exemples GitHub.

Guide de migration et API REST v3.1

Étapes suivantes