Modèle de document ID Intelligence documentaire

Important

  • Les mises en production de préversion publique Document Intelligence fournissent un accès anticipé aux fonctionnalités en cours de développement actif.
  • Les fonctionnalités, approches et processus peuvent changer, avant la disponibilité générale (GA), en fonction des commentaires des utilisateurs.
  • La version d'aperçu publique des bibliothèques clientes Document Intelligence est par défaut la version 2024-02-29-preview de l'API REST.
  • La version d’évaluation publique 2024-02-29-preview est actuellement disponible uniquement dans les régions Azure suivantes :
  • USA Est
  • USA Ouest 2
  • Europe Ouest

Ce contenu s’applique à :cochev4.0 (préversion) | Versions précédentes :coche-bleuev3.1(GA)coche-bleuev3.0 (GA)coche-bleuev2.1 (GA)

Ce contenu s’applique à :cochev3.1 (GA) | Dernière version :coche violettev4.0 (préversion) | Versions précédentes :coche-bleuev3.0coche-bleuev2.1

Ce contenu s’applique à :cochev3.0 (GA) | Dernières versions :coche violettev4.0 (préversion)coche-violettev3.1 | Version précédente :coche-bleuev2.1

Ce contenu s’applique à :cochev2.1 | Dernière version :Coche bleuev4.0 (préversion)

Le modèle Pièce d’identité Intelligence documentaire associe la reconnaissance optique de caractères (OCR) à des modèles Deep Learning pour analyser et extraire les informations clés des pièces d’identité. L’API analyse les pièces d’identité (notamment les suivantes) et retourne une représentation des données JSON structurée :

  • Passeport de type livret, passeport de type carte dans le monde entier
  • Permis de conduire des États-Unis, d’Europe, d’Inde, du Canada et d’Australie
  • Cartes d’identité des États-Unis, titre de séjour (carte verte), carte de sécurité sociale, carte d’identité militaire
  • Cartes d’identité européennes, permis de séjour
  • Carte PAN d’Inde, carte Aadhaar
  • Cartes d’identification du Canada, permis de séjour (carte érable)
  • Carte photo d’Australie, carte d’identité key-pass (y compris la version numérique)

Intelligence documentaire peut analyser et extraire des informations des documents d’identification gouvernementaux à l’aide de son modèle d’ID prédéfini. Il combine nos puissantes fonctionnalités de reconnaissance optique de caractères (OCR) avec des fonctionnalités de reconnaissance d’identités pour extraire des informations clés de passeports internationaux et de permis de conduire émis aux États-Unis (50 États + Washington D.C.). L’API des ID extrait les informations clés de ces documents d’identité, telles que le prénom, le nom, la date de naissance, le numéro du document, etc. Cette API est disponible dans Intelligence documentaire v2.1 sous forme de service cloud.

Traitement de pièce d’identité

Le traitement des documents d’identité implique l’extraction de données de documents d’identité manuellement ou à l’aide de la technologie OCR. Le traitement de pièce d’identité est une étape importante dans toute opération d’entreprise qui nécessite une preuve d’identité. Les exemples incluent la vérification des clients dans les banques et d’autres institutions financières, les demandes de prêts hypothécaires, les visites médicales, le traitement des demandes de remboursement, le secteur de l’hôtellerie et bien plus encore. Les individus fournissent une preuve de leur identité par le biais de permis de conduire, de passeports et d’autres documents similaires afin que l’entreprise puisse les vérifier efficacement avant de fournir des services et des avantages.

Exemple de permis de conduire des États-Unis traité avec Intelligence documentaire Studio

Image d’un exemple de permis de conduire.

Extraction de données

Le service des identités extrait les valeurs clés des passeports internationaux et des permis de conduire émis aux États-Unis, et les renvoie dans une réponse JSON structurée.

Exemple de permis de conduire

Exemple de permis de conduire

Exemple de passeport

Exemple de passeport

Options de développement

Intelligence documentaire v4.0 (2024-02-29-preview, 2023-10-31-preview) prend en charge les applications, les bibliothèques et les outils suivants :

Fonctionnalité Ressources ID de modèle
Modèle de pièce d’identité Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-idDocument

Intelligence documentaire v3.1 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources ID de modèle
Modèle de pièce d’identité Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-idDocument

Intelligence documentaire v3.0 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources ID de modèle
Modèle de pièce d’identité Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-idDocument

Intelligence documentaire v2.1 prend en charge les outils, applications et bibliothèques suivants :

Fonction Ressources
Modèle de pièce d’identité ● Outil d’étiquetage Intelligence Documentaire
API REST
Kit de développement logiciel (SDK) Bibliothèque client
Intelligence Documentaire Conteneur Docker

Critères des entrées

  • Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.

  • Formats de fichiers pris en charge :

    Modèle PDF Image :
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office :
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) et HTML
    Lire
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Document général
    Prédéfinie
    Extraction personnalisée
    Classification personnalisée ✔ (2024-02-29-preview)
  • Pour PDF et TIFF, il est possible de traiter jusqu’à 2 000 pages (avec un abonnement gratuit, seules les deux premières pages sont traitées).

  • La taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).

  • Les dimensions des images doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.

  • Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.

  • La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce (PPP).

  • Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.

    • Pour l’entraînement du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle et 1G-Mo pour le modèle neural.

    • Pour l’entraînement du modèle de classification personnalisée, la taille totale des données de formation est 1GB, avec un maximum à 10 000 pages.

  • Formats de fichiers pris en charge : JPEG, PNG, PDF et TIFF.

  • Nombre de pages prises en charge pour les fichiers PDF et TIFF : jusqu’à 2,000 pages ou uniquement les deux premières pages pour les abonnés de niveau gratuit.

  • Taille de fichier prise en charge : moins de 50 Mo TOTAL. Nombre de pixels minimum : 50 x 50 px. Nombre de pixels maximum : 10 000 x 10 000 px.

Extraction de données du modèle de document d’identité

Extraire les données, notamment le nom, la date de naissance et la date d’expiration, des documents d'identité. Vous avez besoin des ressources suivantes :

  • Un abonnement Azure. Vous pouvez en créer un gratuitement.

  • Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.

Capture d’écran de l’emplacement des clés et des points de terminaison dans le Portail Azure.

Remarque

Intelligence documentaire Studio est disponible avec les API v3.1 et v3.0 et versions ultérieures.

  1. Dans la page d’accueil de Document Intelligence Studio, sélectionnez Documents d’identité.

  2. Vous pouvez analyser l’exemple de facture ou charger vos propres fichiers.

  3. Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :

    Capture d’écran des boutons Exécuter l’analyse et Options d’analyse dans Document Intelligence Studio.

Outil d’étiquetage d’exemples d’Intelligence documentaire

  1. Accédez à l’outil d’exemples Document Intelligence.

  2. Dans la page d’accueil de l’outil d’étiquetage d’échantillon, sélectionnez la vignette Utiliser un modèle prédéfini pour obtenir des données.

    Capture d’écran de l’opération des résultats d’analyse du modèle de disposition.

  3. Sélectionnez le Type de formulaire à analyser dans le menu déroulant.

  4. Choisissez un URL pour le fichier que vous souhaitez analyser à partir des options ci-dessous :

  5. Dans le champ Source, sélectionnez URL dans le menu déroulant, collez l’URL sélectionnée, puis sélectionnez le bouton Récupérer.

    Capture d'écran du menu déroulant de l'emplacement de la source.

  6. Dans le champ Point de terminaison du service Document Intelligence, collez le point de terminaison que vous avez obtenu avec votre abonnement Document Intelligence.

  7. Dans le champ Clé, collez la clé que vous avez obtenue de votre ressource Document Intelligence.

    Capture d’écran montrant le menu déroulant de sélection du type de document.

  8. Cliquez sur Exécuter l’analyse. L’outil d’étiquetage d’exemples d’Intelligence documentaire appelle l’API Analyze Prebuilt (Analyser des éléments prédéfinis) et analyse le document.

  9. Afficher les résultats : consultez les paires clé-valeur extraites, les articles, le texte extrait mis en évidence et les tableaux détectés.

    Capture d’écran de l’opération d’analyse des résultats du modèle d’identité.

  10. Téléchargez le fichier de sortie JSON pour consulter les résultats détaillés.

    • Le nœud « readResults » contient chaque ligne de texte avec sa position de cadre englobant respective dans la page.
    • Le nœud « selectionMarks » affiche chaque marque de sélection (case à cocher, case d’option) et indique si son état est sélectionné ou non sélectionné.
    • La section « pageResults » comprend les tableaux extraits. Pour chaque tableau, Intelligence documentaire extrait le texte, l’index de ligne et de colonne, l’étendue de ligne et de colonne, le cadre englobant, etc.
    • Le champ « documentResults » contient les informations sur les paires clé/valeur et sur les éléments de ligne pour les parties les plus pertinentes du document.

Notes

L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. Il s’agit d’une limite de l’outil et non du service d’Intelligence documentaire.

Types de documents pris en charge

Région Types de documents
Monde entier Passeport de type livret, Passeport de type carte
États-Unis Permis de conduire, Carte d’identité, Titre de séjour (carte verte), Carte de sécurité sociale, Carte d’identité militaire
Europe Permis de conduire, carte d’identité, titre de séjour
Inde Permis de conduire, Carte PAN, Carte Aadhaar
Canada Permis de conduire, Carte d’identité, Titre de séjour (Carte Maple)
Australie Permis de conduire, Carte photo, Carte d’identité Keypass (y compris la version numérique)

Extractions de champs

Voici les champs extraits par type de document. Le modèle de pièce d’identité prebuilt-idDocument d’Intelligence documentaire extrait les champs suivants dans le documents.*.fields. La sortie json inclut tout le texte extrait dans les documents, les mots, les lignes et les styles.

idDocument.driverLicense

Champ Type Description Exemple
CountryRegion countryRegion Code de pays ou de région États-Unis
Region string État ou province Washington
DocumentNumber string Numéro de permis de conduire WDLABCD456DG
DocumentDiscriminator string Discriminateur de document de permis de conduire 12645646464554646456464544
FirstName string Prénom et initiale du second prénom, le cas échéant LIAM R.
LastName string Surname TALBOT
Address address Adresse 123 RUE ADRESSE VOTRE VILLE WA 99999-1234
DateOfBirth date Date de naissance 01/06/1958
DateOfExpiration date Date d’expiration 08/12/2020
DateOfIssue date Date de publication 08/12/2012
EyeColor string Couleur des yeux Bleu
HairColor string Couleur des cheveux Brun
Height string Height 5'11"
Weight string Poids 185LB
Sex string Sex M
Endorsements string Approbations L
Restrictions string Restrictions B
VehicleClassifications string Classification du véhicule D

idDocument.passport

Champ Type Description Exemple
DocumentNumber string Passport number 340020013
FirstName string Prénom et initiale du second prénom, le cas échéant JENNIFER
MiddleName string Nom entre le prénom et le nom REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string Également appelé MAT LIN
DateOfBirth date Date de naissance 1980-01-01
DateOfExpiration date Date d’expiration 2019-05-05
DateOfIssue date Date de publication 2014-05-06
Sex string Sex F
CountryRegion countryRegion Pays ou organisation émettrice États-Unis
DocumentType string Type du document P
Nationality countryRegion Nationalité États-Unis
PlaceOfBirth string Lieu de naissance MASSACHUSETTS, U.S.A.
PlaceOfIssue string Lieu de publication LISBON
IssuingAuthority string Autorité de publication Département d’état des États-Unis
PersonalNumber string Pièce d’identité personnelle. Non. A234567893
MachineReadableZone object Zone lisible par ordinateur (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string Prénom et initiale du second prénom, le cas échéant JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string Passport number 340020013
MachineReadableZone.CountryRegion countryRegion Pays ou organisation émettrice États-Unis
MachineReadableZone.Nationality countryRegion Nationalité États-Unis
MachineReadableZone.DateOfBirth date Date de naissance 1980-01-01
MachineReadableZone.DateOfExpiration date Date d’expiration 2019-05-05
MachineReadableZone.Sex string Sex F

idDocument.nationalIdentityCard

Champ Type Description Exemple
CountryRegion countryRegion Code de pays ou de région États-Unis
Region string État ou province Washington
DocumentNumber string Numéro de carte nationale d’identité tchèque WDLABCD456DG
DocumentDiscriminator string Discriminateur de la carte d’identité nationale 12645646464554646456464544
FirstName string Prénom et initiale du second prénom, le cas échéant LIAM R.
LastName string Surname TALBOT
Address address Adresse 123 RUE ADRESSE VOTRE VILLE WA 99999-1234
DateOfBirth date Date de naissance 01/06/1958
DateOfExpiration date Date d’expiration 08/12/2020
DateOfIssue date Date de publication 08/12/2012
EyeColor string Couleur des yeux BLEU
HairColor string Couleur des cheveux BROWN
Height string Height 5'11"
Weight string Poids 185LB
Sex string Sex M

idDocument.residencePermit

Champ Type Description Exemple
CountryRegion countryRegion Code de pays ou de région États-Unis
DocumentNumber string Numéro de permis de séjour WDLABCD456DG
FirstName string Prénom et initiale du second prénom, le cas échéant LIAM R.
LastName string Surname TALBOT
DateOfBirth date Date de naissance 01/06/1958
DateOfExpiration date Date d’expiration 08/12/2020
DateOfIssue date Date de publication 08/12/2012
Sex string Sex M
PlaceOfBirth string Lieu de naissance Allemagne
Category string Catégorie d’autorisation DV2
Address string Adresse 123 RUE ADRESSE VOTRE VILLE WA 99999-1234

idDocument.usSocialSecurityCard

Champ Type Description Exemple
DocumentNumber string Numéro de carte de sécurité sociale WDLABCD456DG
FirstName string Prénom et initiale du second prénom, le cas échéant LIAM R.
LastName string Surname TALBOT
DateOfIssue date Date de publication 08/12/2012

idDocument

Champ Type Description Exemple
Address address Adresse 123 RUE ADRESSE VOTRE VILLE WA 99999-1234
DocumentNumber string Numéro de permis de conduire WDLABCD456DG
FirstName string Prénom et initiale du second prénom, le cas échéant LIAM R.
LastName string Surname TALBOT
DateOfBirth date Date de naissance 01/06/1958
DateOfExpiration date Date d’expiration 08/12/2020

Types de document pris en charge

Le modèle de document d’identité prend actuellement en charge les permis de conduire délivrés aux États-Unis et la page biographique des passeports internationaux (à l’exclusion des visas et autres documents de voyage).

Champs extraits

Nom Type Description Valeur
Pays ou région country Code pays conforme à la norme ISO 3166 « USA »
DateOfBirth Date Date de naissance au format AAAA-MM-JJ « 1980-01-01 »
DateOfExpiration Date Date d’expiration au format AAAA-MM-JJ « 2019-05-05 »
DocumentNumber string Numéro de passeport, numéro de permis de conduire, etc. « 340020013 »
FirstName string Prénom et initiale du second prénom extraits, le cas échéant « JENNIFER »
LastName string Nom de famille extrait « BROOKS »
Nationalité country Code pays conforme à la norme ISO 3166 « USA »
Sex gender Les valeurs extraites possibles sont « M », « F », « X » "F"
MachineReadableZone object MRZ du passeport extraite, y compris 2 lignes de 44 caractères chacun « P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816 »
DocumentType ; string Type de document, par exemple, passeport ou permis de conduire « passeport »
Adresse string Adresse extraite (permis de conduire uniquement) « 123 STREET ADDRESS YOUR CITY WA 99999-1234 »
Région string Région, État, province et autres informations extraites (permis de conduire uniquement) « Washington »

Guide de migration

Étapes suivantes