Explorer les options de Azure AI Vision pour lire du texte

Effectué

Azure AI propose deux fonctionnalités distinctes qui permettent de lire du texte à partir de documents et d’images, l’une dans le service Azure AI Vision et l’autre dans le service Azure AI Intelligence documentaire. Les fonctions de chaque service se chevauchent, mais chacune est optimisée pour obtenir des résultats adaptés à la nature des données d’entrée.

  • Analyse d’images Reconnaissance optique de caractères (OCR):
    • Utilisez cette fonctionnalité pour les documents généraux et non structurés qui contiennent peu de texte, ou pour les images qui contiennent du texte.
    • Les résultats sont retournés immédiatement (de manière synchrone) à partir d’un simple appel d’API.
    • Dispose de fonctionnalités d’analyse d’images et d’extraction de texte, notamment la détection d’objets, la description ou la catégorisation d’une image, la génération de vignettes intelligentes et bien plus encore.
    • Quelques exemples : panneaux de signalisation, notes manuscrites et enseignes de magasins.
  • Intelligence documentaire :
    • Ce service permet de lire des volumes de texte plus ou moins importants à partir d’images et de documents PDF.
    • Ce service utilise le contexte et la structure du document pour améliorer la précision.
    • L’appel de fonction initial retourne un ID d’opération asynchrone, qui doit être utilisé dans un appel subséquent pour récupérer les résultats.
    • Quelques exemples : reçus, articles et factures.

Vous pouvez accéder aux deux technologies par le biais de l’API REST ou d’une bibliothèque cliente. Dans ce module, nous nous concentrerons sur la fonction de reconnaissance optique de caractères (OCR) dans l’Analyse d’images. Si vous souhaitez en savoir plus sur Document Intelligence, la lecture de ce module vous apportera une bonne introduction.