Modèle de carte de visite Intelligence Documentaire
Article
Important
À partir de Document Intelligence v4.0 et au-delà, le modèle de carte de visite (prebuilt-businessCard) est obsolète. Pour extraire des données à partir de formats de carte de visite, utilisez les éléments suivants :
Ce contenu s’applique à :v3.1 (GA) | Versions précédentes :v3.0v2.1
Ce contenu s’applique à :v3.0 (GA) | Dernières versions :v4.0 (GA)v3.1 | Version précédente :v2.1
[!INCLUDE [applies to v2.1]../(includes/applies-to-v21.md)]
Le modèle de carte de visite Intelligence documentaire combine de puissantes capacités de reconnaissance optique de caractères (OCR) à des modèles d’apprentissage automatique pour analyser et extraire des données à partir des images d’une carte de visite. L’API analyse les cartes de visite imprimées ; extrait des informations clés telles que le prénom, le nom, le nom de la société, l’adresse e-mail et le numéro de téléphone ; et retourne une représentation structurée des données JSON.
Extraction de données de carte de visite
Les cartes de visite sont un excellent moyen de présenter une entreprise ou un professionnel. Le logo de l’entreprise, les polices et les images de fond utilisés sur les cartes de visite aident à promouvoir la marque de l’entreprise et à la démarquer des autres. L’application de techniques basées sur l’OCR et le machine learning pour automatiser l’analyse des cartes de visite est un scénario courant de traitement d’image. Les systèmes d’entreprise utilisés par les équipes de vente et de marketing intègrent généralement une fonctionnalité d’extraction des données de carte de visite qui est bénéfique pour leurs utilisateurs.
Essayer l’extraction de données de carte de visite
Découvrez de quelle manière les données, dont le nom, le poste, l’adresse, l’e-mail et le nom de la société, sont extraites des cartes de visite. Vous avez besoin des ressources suivantes :
Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.
Document Intelligence Studio
Notes
Le Studio d’Intelligence documentaire est disponible avec les API v3.1 et v3.0.
Dans le champ Source, sélectionnez URL dans le menu déroulant, collez l’URL sélectionnée, puis sélectionnez le bouton Récupérer.
Dans le champ Point de terminaison du service Document Intelligence, collez le point de terminaison que vous avez obtenu avec votre abonnement Document Intelligence.
Dans le champ Clé, collez la clé que vous avez obtenue de votre ressource Document Intelligence.
Cliquez sur Exécuter l’analyse. L’outil d’étiquetage des exemples d’Intelligence Documentaire appelle l’API Analyze Prebuilt et analyse le document.
Afficher les résultats : consultez les paires clé-valeur extraites, les articles, le texte mis en évidence extrait et les tableaux détectés.
Notes
L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. Il s’agit d’une limite de l’outil et non du service d’Intelligence documentaire.
Critères des entrées
Formats de fichiers pris en charge :
Modèle
PDF
Image : JPEG/JPG, PNG, BMP, TIFF, HEIF
Microsoft Office : Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lire
✔
✔
✔
Layout
✔
✔
✔
Document général
✔
✔
Prédéfinie
✔
✔
Extraction personnalisée
✔
✔
Classification personnalisée
✔
✔
✔
Pour de meilleurs résultats, fournissez une photo nette ou une copie de qualité par document.
Pour les PDF et TIFF, jusqu'à 2 000 pages peuvent être traitées (avec un abonnement gratuit, seules les deux premières pages sont traitées).
La taille de fichier pour l’analyse de documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
Les dimensions de l’image doivent être comprises entre 50 pixels x 50 pixels et 10 000 pixels x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant leur envoi.
La hauteur minimale du texte à extraire est de 12 pixels pour une image de 1024 x 768 pixels. Cette dimension correspond environ à un texte de 8 points à 150 points par pouce (ppp).
Pour la formation de modèles personnalisés, le nombre maximal de pages pour les données de formation est de 500 pour le modèle personnalisé et 50 000 pour le modèle neural personnalisé.
Pour l’apprentissage du modèle d’extraction personnalisé, la taille totale des données d’entraînement est de 50 Mo pour le modèle de gabarit et de 1 Go pour le modèle neuronal.
Pour l’apprentissage du modèle de classification personnalisé, la taille totale des données d’entraînement est de 1 Go, avec un maximum de 10 000 pages. Pour 2024-11-30 (GA), la taille totale des données d’apprentissage est de 2 Go avec un maximum de 10 000 pages.
Formats de fichiers pris en charge : JPEG, PNG, PDF et TIFF
PDF et TIFF, jusqu’à 2 000 pages sont traitées. Abonnés du niveau Gratuit : seules les deux premières pages sont traitées.
La taille de fichier doit être inférieure à 50 Mo, et les dimensions comprises entre 50 × 50 pixels et 10 000 × 10 000 pixels.
Pour les champs d’extraction de documents pris en charge, consulter la page Schéma du modèle de carte de visite de notre référentiel d’exemples GitHub.
Champs extraits
Nom
Type
Description
Texte
ContactNames
tableau d’objets
Nom de contact extrait de la carte de visite
[{ "FirstName": "John", "LastName": "Doe" }]
FirstName
string
Prénom du contact
"John"
LastName
string
Nom du contact
"Doe"
CompanyNames
tableau de chaînes
Nom de société extrait de la carte de visite
["Contoso"]
Departments
tableau de chaînes
Service ou organisation de contact
["R&D"]
JobTitles
tableau de chaînes
Poste indiqué du contact
["Software Engineer"]
E-mails
tableau de chaînes
E-mail de contact extrait de la carte de visite
["johndoe@contoso.com"]
Sites web
tableau de chaînes
Site web extrait de la carte de visite
["https://www.contoso.com"]
Adresses
tableau de chaînes
Adresse extraite de la carte de visite
["123 Main Street, Redmond, Washington 98052"]
MobilePhones
tableau de numéros de téléphone
Numéro de téléphone mobile extrait de la carte de visite
["+19876543210"]
Télécopies
tableau de numéros de téléphone
Numéro de télécopie extrait de la carte de visite
["+19876543211"]
WorkPhones
tableau de numéros de téléphone
Numéro de téléphone professionnel extrait de la carte de visite
["+19876543231"]
OtherPhones
tableau de numéros de téléphone
Autre numéro de téléphone extrait de la carte de visite
["+19876543233"]
Paramètres régionaux pris en charge
Prebuilt business cards v2.1 prend en charge les paramètres régionaux suivants :
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.