Qu’est-ce qu’Azure Document Intelligence ?

Effectué

Conseil / Astuce

Pour plus d’informations, consultez l’onglet Texte et images !

Azure Document Intelligence est un service IA basé sur le cloud dans Microsoft Foundry qui utilise des modèles OCR et Deep Learning pour extraire du texte, des paires clé-valeur, des marques de sélection et des tables à partir de documents.

OCR capture la structure de document en créant des zones englobantes autour des objets détectés dans une image. Les emplacements des rectangles englobants sont enregistrés en tant que coordonnées par rapport au reste de la page. Azure Document Intelligence retourne des données de boîte délimitante et d'autres informations dans un format JSON structuré qui conserve les relations du document d’origine.

Capture d’écran montrant Document Intelligence analysant un exemple de document avec des champs extraits et des zones englobantes.

Pour créer un modèle d’extraction de documents haute précision à partir de zéro, nécessite une expertise en apprentissage profond, de grandes quantités de calcul et de longues périodes d’apprentissage. Azure Document Intelligence fournit des modèles sous-jacents déjà formés sur des milliers d’exemples de formulaires, ce qui vous permet d’obtenir une extraction de données haute précision avec un effort minimal.

Composants du service Document Intelligence

Azure Document Intelligence se compose de trois catégories de modèles :

  • Modèles d’analyse de document : extraire du texte, de la structure, des tableaux et des marques de sélection à partir de documents. Le modèle de lecture extrait du texte et détecte les langues, tandis que le modèle de disposition ajoute l’extraction de table et de structure. Vous allez explorer ces modèles en détail dans l’unité Utiliser des modèles prédéfinis .

  • Modèles prédéfinis : extrayez des informations à partir de types de documents courants, tels que les factures, les reçus, les formulaires fiscaux, les documents d’ID et bien plus encore, sans aucune formation requise. Vous verrez la liste complète des modèles prédéfinis disponibles dans l’unité Utiliser des modèles prédéfinis .

  • Modèles personnalisés : extrayez des données à partir de formulaires spécifiques à votre entreprise à l’aide de vos propres jeux de données étiquetés. Les options incluent des modèles de modèles personnalisés (rapides et rentables pour les dispositions fixes), des modèles neuronaux personnalisés (plus précis pour différentes dispositions), des modèles composés et des classifieurs personnalisés. Vous découvrirez l’apprentissage et l’utilisation de modèles personnalisés dans l’unité Entraîner et utiliser des modèles personnalisés .

Accéder aux services Document Intelligence

Vous pouvez accéder à Azure Document Intelligence de plusieurs façons :

  • API REST : appelez le service directement à l’aide de requêtes HTTP.
  • Kits de développement logiciel (SDK) de bibliothèque de client : utilisez des kits SDK pour Python, C#, Java et JavaScript.
  • Document Intelligence Studio : outil en ligne pour explorer visuellement, tester et créer des solutions Document Intelligence.
  • Portail Microsoft Foundry : Intégrer Document Intelligence à d’autres outils Foundry.

Conseil / Astuce

L’exercice de ce module se concentre sur le Kit de développement logiciel (SDK) Python. Les services REST sous-jacents peuvent être utilisés par n’importe quelle langue.

Créer une ressource Intelligence documentaire

Pour utiliser Azure Document Intelligence, vous avez besoin d’une ressource Azure. Vous pouvez utiliser au choix :

  • Ressource Foundry : un abonnement multiservice qui fournit l’accès à plusieurs services d’IA via un point de terminaison et une clé uniques.
  • Ressource Azure Document Intelligence : ressource à service unique utilisée uniquement avec Document Intelligence.

Note

Créez une ressource Foundry si vous envisagez d’accéder à plusieurs outils Foundry sous un seul point de terminaison et clé. Pour l’accès à Document Intelligence uniquement, créez une ressource Document Intelligence dédiée.

Exigences d'entrée

Azure Document Intelligence fonctionne sur les documents d’entrée qui répondent à ces exigences :

  • Le format doit être JPEG, PNG, BMP, PDF (texte ou numérisé) ou TIFF. Le modèle de lecture accepte également les formats de fichiers Microsoft Office.
  • La taille de fichier doit être inférieure à 500 Mo pour le niveau standard et 4 Mo pour le niveau gratuit.
  • Les dimensions des images doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
  • Les documents PDF doivent avoir des dimensions inférieures à 17 x 17 pouces (format de papier A3).
  • Les documents PDF ne doivent pas être protégés par mot de passe.

En savoir plus