Partage via


Modèle de certificat de mariage Intelligence documentaire

Ce contenu s’applique à :cochev4.0 (préversion)coche

Le modèle de certificat de mariage Intelligence documentaire utilise de puissantes capacités de reconnaissance optique de caractères (OCR) pour analyser et extraire les champs clés des certificats de mariage. Les certificats de mariage peuvent être de formats et de qualités divers, notamment des images capturées par téléphone, des documents numérisés et des fichiers PDF. L’API analyse le texte du document, extrait des informations clés telles que les noms des époux, la date d’émission et le lieu du mariage, et retourne une représentation sous forme de données JSON structurées. Le modèle prend actuellement en charge les formats de document en anglais.

Traitement automatisé des certificats de mariage

Le traitement automatisé des certificats de mariage est le processus d’extraction des champs clés à partir des certificats de mariage. Historiquement, le processus d’analyse de certificats de mariage était réalisé manuellement et prenait donc beaucoup de temps. L’extraction précise des données clés à partir de certificats de mariage est généralement la première et l’une des étapes les plus critiques du processus d’automatisation des certificats de mariage.

Options de développement

Intelligence documentaire v4.0 (2024-02-29-preview) prend en charge les outils, applications et bibliothèques suivants :

Fonctionnalité Ressources ID de modèle
prebuilt-marriageCertificate.us Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
prebuilt-marriageCertificate.us

Critères des entrées

  • Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.

  • Formats de fichiers pris en charge :

    Modèle PDF Image :
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office :
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) et HTML
    Lire
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Document général
    Prédéfinie
    Extraction personnalisée
    Classification personnalisée ✔ (2024-02-29-preview)
  • Pour PDF et TIFF, il est possible de traiter jusqu’à 2 000 pages (avec un abonnement gratuit, seules les deux premières pages sont traitées).

  • La taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).

  • Les dimensions des images doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.

  • Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.

  • La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce (PPP).

  • Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.

    • Pour l’entraînement du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle et 1G-Mo pour le modèle neural.

    • Pour l’entraînement du modèle de classification personnalisée, la taille totale des données de formation est 1GB, avec un maximum à 10 000 pages.

Essayer l’extraction des données de document de certificat de mariage

Pour voir comment l’extraction de données fonctionne pour le service de certificats de mariage, vous avez besoin des ressources suivantes :

  • Un abonnement Azure. Vous pouvez en créer un gratuitement.

  • Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.

Capture d’écran de l’emplacement des clés et des points de terminaison dans le Portail Azure.

Document Intelligence Studio

  1. Dans la page d’accueil de Document Intelligence Studio, sélectionnez Marriage Certificate.

  2. Vous pouvez analyser les exemples de certificats de mariage ou charger vos propres fichiers.

  3. Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :

    Capture d’écran des boutons Exécuter l’analyse et Options d’analyse dans Document Intelligence Studio.

Langues et régions prises en charge

Pour obtenir la liste complète des langues prises en charge, consultez notre page Prise en charge des langues : Modèles prédéfinis.

Extraction de champ

Voici les champs extraits d’un certificat de mariage dans la réponse de sortie JSON.

Nom Type Description Exemple de sortie
Spouse1FirstName Chaîne Prénom du conjoint 1 Wesley
Spouse1MiddleName Chaîne Deuxième prénom du conjoint 1 M.
Spouse1LastName Chaîne Nom de famille du conjoint 1 Perry
Spouse1Age Entier Âge du conjoint 1 26
Spouse1BirthDate Date Date de naissance du conjoint 1 16 novembre 1997
Spouse1Address Adresse Adresse du conjoint 1 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302
Spouse1BirthPlace Chaîne Lieu de naissance du conjoint 1 Michigan
Spouse2FirstName Chaîne Prénom du conjoint 2 Beth
Spouse2MiddleName Chaîne Deuxième prénom du conjoint 2 R.
Spouse2LastName Chaîne Nom de famille du conjoint 2 Mason
Spouse2Age Entier Âge du conjoint 2 23
Spouse2BirthDate Date Date de naissance du conjoint 2 22 juillet 2000
Spouse2Address Adresse Adresse du conjoint 2 2671 Comfort Court, Madison, Wisconsin 53704
Spouse2BirthPlace Chaîne Lieu de naissance du conjoint 2 Wisconsin
DocumentNumber Chaîne Numéro de référence 01976/202
IssueDate Date Date d’émission du certificat 10 octobre 2023
IssuePlace Chaîne Lieu d’émission du certificat 2398 Echo Lane, Hastings, Michigan 49058
MarriageDate Date Date du mariage 10 octobre 2023
MarriagePlace Chaîne Lieu du mariage 105 Coal Street, Galloway, Wisconsin 54432

Les paires clé-valeur et les éléments de ligne de certificat de mariage extraits se trouvent dans la section documentResults de la sortie JSON.

Étapes suivantes