Modèle de certificat de mariage Intelligence documentaire
Ce contenu s’applique à : v4.0 (préversion)
Le modèle de certificat de mariage Intelligence documentaire utilise de puissantes capacités de reconnaissance optique de caractères (OCR) pour analyser et extraire les champs clés des certificats de mariage. Les certificats de mariage peuvent être de formats et de qualités divers, notamment des images capturées par téléphone, des documents numérisés et des fichiers PDF. L’API analyse le texte du document, extrait des informations clés telles que les noms des époux, la date d’émission et le lieu du mariage, et retourne une représentation sous forme de données JSON structurées. Le modèle prend actuellement en charge les formats de document en anglais.
Traitement automatisé des certificats de mariage
Le traitement automatisé des certificats de mariage est le processus d’extraction des champs clés à partir des certificats de mariage. Historiquement, le processus d’analyse de certificats de mariage était réalisé manuellement et prenait donc beaucoup de temps. L’extraction précise des données clés à partir de certificats de mariage est généralement la première et l’une des étapes les plus critiques du processus d’automatisation des certificats de mariage.
Options de développement
Intelligence documentaire v4.0 (2024-07-31-preview) prend en charge les outils, applications et bibliothèques suivants :
Fonctionnalité | Ressources | ID de modèle |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript |
prebuilt-marriageCertificate.us |
Critères des entrées
Formats de fichiers pris en charge :
Modèle PDF Image : JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office :
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLire ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Document général ✔ ✔ Prédéfinie ✔ ✔ Extraction personnalisée ✔ ✔ Classification personnalisée ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.
Pour les PDF et TIFF, jusqu'à 2 000 pages peuvent être traitées (avec un abonnement gratuit, seules les deux premières pages sont traitées).
La taille de fichier pour l’analyse de documents est de 500 Mo pour le niveau payant (S0) et de
4
Mo pour le niveau gratuit (F0).Les dimensions de l’image doivent être comprises entre 50 pixels x 50 pixels et 10 000 pixels x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.
La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond environ à un texte de
8
points à 150 points par pouce (ppp).Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.
Pour l’apprentissage du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle de gabarit et de
1
Go pour le modèle neuronal.Pour l’apprentissage du modèle de classification personnalisé, la taille totale des données d’entraînement est de
1
Go, avec un maximum de 10 000 pages. Pour 2024-07-31-preview et les versions ultérieures, la taille totale des données d’entraînement est de2
Go, avec un maximum de 10 000 pages.
Essayer l’extraction des données de document de certificat de mariage
Pour voir comment l’extraction de données fonctionne pour le service de certificats de mariage, vous avez besoin des ressources suivantes :
Un abonnement Azure. Vous pouvez en créer un gratuitement.
Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (
F0
) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.
Document Intelligence Studio
Sur la page d’accueil d’Intelligence documentaire Studio, sélectionnez Certificat de mariage.
Vous pouvez analyser les exemples de certificats de mariage ou charger vos propres fichiers.
Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :
Langues et régions prises en charge
Pour obtenir la liste complète des langues prises en charge, consultez notre page de prise en charge des langues dans les modèles prédéfinis.
Extraction de champ
Pour obtenir les champs d’extraction de documents pris en charge, reportez-vous à la page du schéma du modèle de certificat de mariage dans notre dépôt d’exemples GitHub.
Les paires clé-valeur et les éléments de ligne de certificat de mariage extraits se trouvent dans la section
documentResults
de la sortie JSON.
Étapes suivantes
Essayez de traiter vos propres formulaires et documents avec Document Intelligence Studio.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.