Qu’est-ce qu’Azure Document Intelligence ?
Azure Document Intelligence est l’un des nombreux outils Foundry, services d’intelligence artificielle (IA) basés sur le cloud avec des API REST et des KITS SDK de bibliothèque de client qui peuvent être utilisés pour générer de l’intelligence dans vos applications.
Azure Document Intelligence utilise des fonctionnalités ocr (Reconnaissance optique de caractères) et des modèles d’apprentissage profond pour extraire du texte, des paires clé-valeur, des marques de sélection et des tables à partir de documents.
OCR capture la structure de document en créant des zones englobantes autour des objets détectés dans une image. Les emplacements des zones englobantes sont enregistrés en tant que coordonnées par rapport au reste de la page. Les services Azure Document Intelligence retournent des données de box englobantes et d’autres informations dans un formulaire structuré avec les relations du fichier d’origine.
Pour créer un modèle haute précision à partir de zéro, les utilisateurs doivent créer des modèles d’apprentissage profond, utiliser une grande quantité de ressources de calcul et faire face à de longues périodes d’apprentissage des modèles. Ces facteurs pourraient rendre un projet irrécible. Azure Document Intelligence fournit des modèles sous-jacents qui ont été formés sur des milliers d’exemples de formulaires. Les modèles sous-jacents vous permettent d’effectuer une extraction de données à haute précision à partir de vos formulaires avec peu à aucun entraînement de modèle.
Composants du service Azure Document Intelligence
Azure Document Intelligence est composé des services suivants :
modèles d’analyse de document: qui prennent une entrée de fichiers JPEG, PNG, PDF et TIFF et retournent un fichier JSON avec l’emplacement du texte dans des zones englobantes, du contenu de texte, des tableaux, des marques de sélection (également appelés cases à cocher ou cases d’option) et une structure de document.
modèles prédéfinis: qui détectent et extraient des informations à partir d’images de document et retournent les données extraites dans une sortie JSON structurée. Azure Document Intelligence prend actuellement en charge les modèles prédéfinis pour plusieurs formulaires, notamment :
- Formulaires W-2
- Factures
- Reçus
- Documents d’ID
- Cartes de visite
modèles personnalisés: des modèles personnalisés extraient des données à partir de formulaires spécifiques à votre entreprise. Les modèles personnalisés peuvent être entraînés via les Azure Document Intelligence Studio.
Remarque
Certaines fonctionnalités d’Azure Document Intelligence sont en préversion, à compter du moment où ce contenu a été créé et, par conséquent, les fonctionnalités et les détails d’utilisation peuvent changer. Vous devez faire référence à la page officielle pour les informations de up-to-date.
Accéder aux services
Vous pouvez accéder aux services Azure Document Intelligence de plusieurs façons. Ces options incluent l’utilisation de :
- UNE API REST
- SDK des bibliothèques clientes
- Azure Document Intelligence Studio
- Microsoft Foundry
Conseil / Astuce
L’exercice de ce module se concentre sur les kits SDK Python et .NET. Les services REST sous-jacents peuvent être utilisés par n’importe quelle langue.
Consultez la documentation pour obtenir des guides de démarrage rapide sur tous les kits SDK disponibles et l’API REST.