Qu’est-ce qu’Azure AI Intelligence Documentaire ?
Important
- Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif.
- Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
- La version d'aperçu publique des bibliothèques clientes Document Intelligence est par défaut la version 2024-02-29-preview de l'API REST.
- La version d’évaluation publique 2024-02-29-preview est actuellement disponible uniquement dans les régions Azure suivantes :
- USA Est
- USA Ouest 2
- Europe Ouest
Ce contenu s’applique à : v4.0 (préversion) | Versions précédentes : v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ce contenu s’applique à : v3.1 (GA) | Dernière version : v4.0 (préversion) | Versions précédentes : v3.0 v2.1
Ce contenu s’applique à : v3.0 (GA) | Dernières versions : v4.0 (préversion) v3.1 | Version précédente : v2.1
Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (préversion)
Remarque
Form Recognizer est désormais Azure AI Intelligence Documentaire !
- Depuis juillet 2023, les services Azure AI englobent tout ce qui était auparavant connu sous le nom Cognitive Services et Azure Applied AI Services.
- Il n’y a aucune modification de la tarification.
- Les noms Cognitive Services et Azure Applied AI continuent d’être utilisés dans la facturation Azure, l’analyse des coûts, la liste de prix et les API de prix.
- Il n’existe aucun changement cassant des interfaces de programmation d’applications (API) ou des Kits de développement logiciel (SDK) antérieurs et jusqu’à la version v3.1. À partir de v4.0, les API et SDK sont mis à jour dans Intelligence documentaire.
- Certaines plateformes attendent toujours la mise à jour du changement de nom. Toutes les mention de Form Recognizer ou Intelligence documentaire dans notre documentation font référence au même service Azure.
Azure AI Intelligence Documentaire est un service cloud Azure AI Services, qui permet aux développeurs de créer des solutions intelligentes de traitement de documents. Des quantités massives de données, couvrant une grande variété de types de données, sont stockées dans des formulaires et des documents. Intelligence Documentaire permet de gérer efficacement la vitesse à laquelle les données sont collectées et traitées, ce qui est essentiel pour améliorer les opérations, prendre des décisions fondées sur des données et innover de manière éclairée.
| ✔️ Modèles d’analyse de documents | ✔️ Modèles prédéfinis | ✔️ Modèles personnalisés |
Modèles d’analyse de documents
Les modèles d’analyse de documents permettent l’extraction de texte à partir de formulaires et de documents, et renvoient un contenu structuré prêt à être développé ou utilisé par votre organisation.
Lire | Extraire du texte imprimé
et manuscrit
Disposition | Extrayez le texte, les tables
et la structure du document.
Lire | Extraire du texte imprimé
et manuscrit
Disposition | Extrayez le texte, les tables
et la structure du document.
Document général : extrait le texte,
les tableaux, la structure, les paires clé-valeur.
Modèles prédéfinis
Les modèles préconstruits vous permettent d'ajouter un traitement intelligent des documents à vos applications et flux sans avoir à former et construire vos propres modèles.
Facture | Extraire les détails des clients et des fournisseurs.
Reçu | Extraire les détails des transactions de ventes.
Identité | Extraire les détails de vérification.
Prêt hypothécaire américain 1003 | Extraire les détails de demandes de prêts.
Prêt hypothécaire américain 1008 | Extraire les détails de transfert de prêts.
Divulgation des prêts hypothécaires aux États-Unis | Extraire les conditions finales de prêts.
Carte d’assurance maladie | Extraire les détails de couverture d’assurance maladie.
Contrat | Extraire les détails des contrats et des parties.
Carte de crédit/débit | Extraire les informations de carte de paiement.
Certificat de mariage | Extraire les informations de mariage certifiées.
Formulaire fiscal américain W-2 | Extraire les détails de la rémunération imposable.
Formulaire US Tax 1098 | Extrayez les détails des intérêts hypothécaires.
Formulaire US Tax 1098-E | Extraire les détails des intérêts du prêt étudiant.
Formulaire US Tax 1098-T | Extrayez les détails des frais de scolarité qualifiés.
Formulaire fiscal américain 1099 | Extraire les détails des variantes du formulaire 1099.
Formulaire fiscal américain 1040 | Extraire les détails des variantes du formulaire 1040.
Facture | Extrayez les détails du client
et du fournisseur.
Reçu | Extraire les détails de la
transaction de vente.
Identité | Extrayez les détails d’identification
et de vérification.
Carte d’assurance maladie | Extraire les détails de l’assurance maladie.
Carte de visite | Extrayez les informations de contact professionnelles.
Contrat | Extrayez les détails des contrats
et des parties.
Formulaire US Tax W-2 | Extraire les détails
de la rémunération imposable.
Formulaire US Tax 1098 | Extrayez les détails des intérêts hypothécaires.
Formulaire US Tax 1098-E | Extraire les détails des intérêts du prêt étudiant.
Formulaire US Tax 1098-T | Extrayez les détails des frais de scolarité qualifiés.
Modèles personnalisés
- Des modèles personnalisés sont formés à l'aide de vos ensembles de données étiquetés pour extraire des données distinctes à partir de formulaires et de documents, en fonction de vos cas d'utilisation.
- Ces modèles personnalisés autonomes peuvent être combinés pour créer des modèles composés.
- Modèles d’extraction
✔️ Les modèles d’extraction personnalisés sont entraînés pour extraire des champs étiquetés à partir de documents.
Modèle personnalisé | Extrayez des données à partir de dispositions statiques.
Neuronal personnalisé | Extrayez des données à partir de documents de type mixte.
Composition personnalisée | Extrayez des données à l’aide d’une collection de modèles.
- Modèle de classification
✔️ Les classifieurs personnalisés identifient les types de documents avant d’appeler un modèle d’extraction.
Classifieur personnalisé | Identifier les types de documents (classes) désignés
avant d’appeler un modèle d’extraction.
Fonctionnalités du module complémentaire
Document Intelligence prend en charge des fonctionnalités facultatives qui peuvent être activées et désactivées en fonction du scénario d’extraction de document. Les fonctionnalités de module complémentaire suivantes sont disponibles pour 2023-07-31 (GA)
et les versions ultérieures :
Document Intelligence prend en charge des fonctionnalités facultatives qui peuvent être activées et désactivées en fonction du scénario d’extraction de document. Les fonctionnalités suivantes du module complémentaire sont disponibles pour 2024-02-29-preview
, 2023-10-31-preview
et les versions ultérieures :
Fonctionnalités d’analyse
ID de modèle | Extraction de contenu | Champs de requête | Paragraphes | Rôles de paragraphe | Marques de sélection | Tables | Paires clé-valeur | Langages | Codes-barres | Analyse de documents | Formules* | Police de style* | Haute résolution* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | ✓ | O | O | O | O | O | |||||||
prebuilt-layout | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
prebuilt-document | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |
prebuilt-businessCard | ✓ | ✓ | ✓ | ||||||||||
prebuilt-contract | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
Facture prédéfinie | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | ||
prebuilt-receipt | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1099(variations) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1040(variations) | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Activé
O - Facultatif
* - Les fonctionnalités Premium entraînent des coûts supplémentaires
Modèles et options de développement
Notes
Les modèles de compréhension de documents et les options de développement ci-après sont pris en charge par le service Intelligence Documentaire v3.0.
Utilisez Intelligence Documentaire pour automatiser le traitement de documents dans les applications et les workflows, afin d’améliorer les stratégies pilotées par les données, puis pour enrichir les fonctionnalités de recherche de documents. Utilisez les liens du tableau pour en savoir plus sur chaque modèle et parcourir les options de développement.
Lire
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-read | ● Extraire du texte à partir de documents. ● Extraction de données |
● Numériser n’importe quel document. ● Conformité et audit. ● Traitement des notes manuscrites avant la traduction. |
● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Layout
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-layout | ● Extraire des informations de texte et de disposition à partir de documents. ● Extraction de données |
● Indexation et récupération de documents par structure. ● Analyse de rapports financiers et médicaux. |
● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Document général (déconseillé dans 2023-10-31-preview)
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-document | ● Extraire les informations de texte, disposition et paires clé-valeur des documents. ● Extraction de données et de champs |
● Extraction de paire clé-valeur. ● Traitement des formulaires. ● Collecte et analyse des données d’enquête. |
● Studio Intelligence Documentaire ● API REST |
Facture
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
Facture prédéfinie | ● Extraire les informations clés des factures. ● Extraction de données et de champs |
● Traitement des comptes fournisseurs. ● Enregistrement et rapports fiscaux automatisés. |
● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Réception
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-receipt | ● Extraire les informations clés des reçus. ● Extraction de données et de champs ● Le modèle de reçu v3.0 prend en charge le traitement des reçus d'hôtel d'une seule page. |
● Gestion des dépenses. ● Analyse des données de comportement des consommateurs. ● Programme de fidélisation de la clientèle. ● Traitement des retours de marchandises. ● Enregistrement et rapports fiscaux automatisés. |
● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Identité (ID)
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-idDocument | ● Extraire les informations clés des passeports et des cartes d'identité. ● Types de documents ● Extraire les mentions, les restrictions et les classifications de véhicules des permis de conduire américains. |
● Conformité aux directives des services financiers KYC (Know Your Customer). ● Gestion des comptes médicaux. ● Points de contrôle et passerelles d’identité. ● Inscription à un hôtel. |
● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Formulaire de prêt hypothécaire américain 1003
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-mortgage.us.1003 | ● Extraire les informations clés des demandes de prêt 1003 . ● Extraction de données et de champs |
● Exigences en matière de documentation pour Fannie Mae et Freddie Mac. | ● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Formulaire de prêt hypothécaire américain 1008
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-mortgage.us.1008 | ● Extraire des informations clés de Uniform Underwriting and Transmittal Summary. ● Extraction de données et de champs |
● Traitement de la souscription de prêts à l’aide de données récapitulatives. | ● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Formulaire de divulgation d’hypothèque aux États-Unis
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-mortgage.us.closingDisclosure | ● Extraire des informations clés de Uniform Underwriting and Transmittal Summary. ● Extraction de données et de champs |
● Exigences relatives aux détails finaux du prêt hypothécaire. | ● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Carte d’assurance maladie
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-healthInsuranceCard.us | ● Extraire les informations clés des cartes d’assurance maladie américaines. ● Extraction de données et de champs |
● Vérification de la couverture et de l’éligibilité. ● Modélisation prédictive. ● Analytique basée sur les valeurs. |
● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Modèle de contrat
ID de modèle | Description | Options de développement |
---|---|---|
prebuilt-contract | Extraire les détails du contrat et des parties. ● Extraction de données et de champs |
● Document Intelligence Studio ● API REST ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Modèle de carte de crédit
ID de modèle | Description | Options de développement |
---|---|---|
prebuilt-creditCard | Extrayez les détails du contrat et de la partie. ● Extraction de données et de champs |
● Document Intelligence Studio ● API REST ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Modèle de certificat de mariage
ID de modèle | Description | Options de développement |
---|---|---|
prebuilt-marriageCertificate.us | Extrayez les détails du contrat et de la partie. ● Extraction de données et de champs |
● Document Intelligence Studio ● API REST ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Modèle fiscal américain W-2
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-tax.us.W-2 | ● Extraire les informations clés des formulaires fiscaux IRS US W2 (année 2018-2021). ● Extraction de données et de champs |
● Gestion automatisée des documents fiscaux. ● Traitement des demandes de prêt hypothécaire. |
● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Formulaire fiscal américain 1098
ID de modèle | Description | Options de développement |
---|---|---|
prebuilt-tax.us.1098 | Extrayez des informations et des détails sur les intérêts hypothécaires. ● Extraction de données et de champs |
● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Formulaire fiscal américain 1098-E
ID de modèle | Description | Options de développement |
---|---|---|
prebuilt-tax.us.1098E | Extrayez des informations et des détails sur les prêts étudiants. ● Extraction de données et de champs |
● Studio Intelligence Documentaire ● ● API REST ● Kit de développement logiciel (SDK) C# ● Kit de développement logiciel (SDK) Python ● Kit de développement logiciel (SDK) Java ● JavaScript |
Formulaire fiscal américain 1098-T
ID de modèle | Description | Options de développement |
---|---|---|
prebuilt-tax.us.1098T | Extrayez des informations et des détails sur les frais de scolarité. ● Extraction de données et de champs |
● Studio Intelligence Documentaire ● API REST |
Formulaire fiscal américain 1099 (et variantes)
ID de modèle | Description | Options de développement |
---|---|---|
prebuilt-tax.us.1099{variation } |
Extraire des informations à partir des variantes du formulaire 1099. | ● ● Extraction de champs et de données Document Intelligence Studio ● API REST ● Kit de développement logiciel (SDK) C# ● Kit de développement logiciel (SDK) Python ● Kit de développement logiciel (SDK) Java ● JavaScript |
Formulaire fiscal américain 1040
ID de modèle | Description | Options de développement |
---|---|---|
prebuilt-tax.us.1040 | Extraire des informations à partir des variantes du formulaire 1040. | ● ● Extraction de champs et de données Document Intelligence Studio ● API REST ● Kit de développement logiciel (SDK) C# ● Kit de développement logiciel (SDK) Python ● Kit de développement logiciel (SDK) Java ● JavaScript |
Carte de visite
ID de modèle | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
prebuilt-businessCard | ● Extraire les informations clés des cartes de visite. ● Extraction de données et de champs |
● Gestion des prospects et du marketing. | ● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● JavaScript |
Aperçu du modèle personnalisé
À propos de | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
Modèle personnalisé | Extraction d'informations à partir de formulaires et de documents en données structurées sur la base d'un modèle créé à partir d'un ensemble de documents de formation représentatifs. | Extrayez des données distinctes à partir de formulaires et de documents spécifiques à votre entreprise et à vos cas d'utilisation. | ● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Java ● SDK JavaScript ● SDK Python |
Modèle personnalisé
Notes
Pour former un modèle personnalisé, définissez la buildMode
propriété sur template
.
Pour plus d’informations, consultez Formation d’un modèle
À propos de | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
Modèle personnalisé | Le modèle de modèle personnalisé extrait des valeurs et des champs étiquetés à partir de documents structurés et semi-structurés. |
Extraire des données clés à partir de documents hautement structurés avec des modèles visuels définis ou des mises en page visuelles communes, des formulaires. | ● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Python ● SDK Java ● SDK JavaScript |
Modèle neuronal personnalisé
Notes
Pour former un modèle personnalisé, définissez la buildMode
propriété sur neural
.
Pour plus d’informations, consultez Formation d’un modèle neural
À propos de | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
Modèle neuronal personnalisé | Le modèle neuronal personnalisé est utilisé pour extraire des données étiquetées à partir de documents structurés (enquêtes, questionnaires), semi-structurés (factures, bons de commande) et non structurés (contrats, lettres). | Extrayez des données textuelles, des cases à cocher et des champs tabulaires à partir de documents structurés et non structurés. | Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Java ● SDK JavaScript ● SDK Python |
Composé sur mesure
À propos de | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
Modèles personnalisés composés | Pour créer un modèle composé, vous associez une collection de modèles personnalisés à un modèle unique créé à partir de vos types de formulaire. | Utile lorsque vous formulez plusieurs modèles et que vous souhaitez les regrouper pour analyser des types de formulaires similaires, tels que les bons de commande. | ● Studio Intelligence Documentaire ● API REST ● SDK C# ● SDK Java ● SDK JavaScript ● SDK Python |
Modèle de classification personnalisé
À propos de | Description | Cas d'utilisation de l'automatisation | Options de développement |
---|---|---|---|
Modèles de classification composés | Les modèles de classification personnalisés combinent des caractéristiques de mise en page et de langue pour détecter, identifier et classer les documents dans un fichier d'entrée. | ● Un dossier de demande de prêt contenant un formulaire de demande, un bulletin de salaire et un relevé bancaire. ● Une collection de factures numérisées. |
● Studio Intelligence Documentaire ● API REST |
Azure AI Intelligence Documentaire est un service cloud Azure AI Services, qui permet aux développeurs de créer des solutions intelligentes de traitement de documents. Intelligence Documentaire applique des technologies de reconnaissance optique de caractères (OCR) et de compréhension de documents basées sur le machine learning pour extraire le texte, les tableaux, la structure et les paires clé-valeur des documents. Vous pouvez également étiqueter et entraîner des modèles personnalisés pour automatiser l’extraction de données à partir de documents structurés, semi-structurés et non structurés. Pour en savoir plus sur chaque modèle, consultez les articles sur les concepts :
Type de modèle | Nom du modèle |
---|---|
Modèle d’analyse de documents | ● Modèle d’analyse de disposition |
Modèles prédéfinis | ● Modèle de facture ● Modèle de reçu ● Modèle de document d’identité (ID) ● Modèle de carte de visite |
Modèles personnalisés | ● Modèle personnalisé ● Modèle composé |
Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (préversion)
Modèles et options de développement d’Intelligence Documentaire
Conseil
- Pour une expérience améliorée et une qualité de modèle avancée, essayez Studio Intelligence Documentaire v3.0.
- V3.0 Studio prend en charge n’importe quel modèle entraîné avec des données étiquetées v2.1.
- Vous pouvez consulter le guide de migration d’API pour obtenir des informations détaillées sur la migration de v2.1 vers v3.0.
Notes
Les modèles et les options de développement ci-après sont pris en charge par le service Intelligence Documentaire v2.1.
Utilisez les liens du tableau pour en savoir plus sur chaque modèle et parcourir les références d’API :
Sécurité et confidentialité des données
Comme pour tous les autres services IA, les développeurs qui utilisent le service Intelligence Documentaire doivent connaître la politique de Microsoft relative aux données client. Consultez notre page Données, confidentialité et sécurité avec Intelligence Documentaire.
Étapes suivantes
Essayez de traiter vos propres formulaires et documents avec Document Intelligence Studio.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.
Essayez de traiter vos propres formulaires et documents avec l’outil d’étiquetage d’échantillons Intelligence Documentaire.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.
Commentaires
https://aka.ms/ContentUserFeedback.
Prochainement : Tout au long de l'année 2024, nous supprimerons progressivement les GitHub Issues en tant que mécanisme de retour d'information pour le contenu et nous les remplacerons par un nouveau système de retour d'information. Pour plus d’informations, voir:Soumettre et afficher des commentaires pour