Utiliser un ensemble de compétences pour définir un pipeline d’enrichissement

Effectué

L’enrichissement par IA fait référence au traitement des images incorporées et du langage naturel dans un pipeline qui extrait le texte et les informations du contenu qui sans cela ne peut pas être indexé pour la recherche en texte intégral.

Le traitement par IA est réalisé en ajoutant et en combinant des compétences dans un ensemble de compétences. Un ensemble de compétences définit les opérations qui extraient et enrichissent des données afin qu’elles puissent faire l’objet de recherches. Ces compétences IA peuvent être des compétences intégrées, comme la traduction de texte ou la reconnaissance optique de caractères (OCR), ou des compétences personnalisées que vous fournissez.

Compétences intégrées

Les compétences intégrées sont basées sur des modèles préentraînés de Microsoft, ce qui signifie que vous ne pouvez pas entraîner le modèle en utilisant vos propres données d’entraînement. Les compétences qui appellent les API Azure AI services ont une dépendance sur ces services et sont facturées au tarif du paiement à l’accès d’Azure AI services quand vous associez une ressource. D’autres compétences sont mesurées par Recherche Azure AI ou sont des compétences utilitaires disponibles sans frais.

Les compétences intégrées se répartissent en fonction des catégories suivantes :

Compétences de traitement en langage naturel : avec ces compétences, le texte non structuré est mappé en tant que champs pouvant faire l’objet d’une recherche et être filtrés dans un index.

Voici quelques exemples :

  • Extraction de phrases clés : cette compétence utilise un modèle préentraîné pour détecter les expressions importantes en fonction de l’emplacement du terme, de règles linguistiques, de la proximité d’autres termes et du caractère inhabituel du terme dans les données sources.

  • Compétence de traduction de texte : cette compétence utilise un modèle préentraîné afin de traduire le texte d’entrée dans différentes langues pour les cas d’usage de normalisation ou de localisation.

Compétences de traitement d’images : créent des représentations textuelles de contenu d’image, ce qui permet d’y faire des recherches en utilisant les fonctionnalités de Recherche Azure AI.

Voici quelques exemples :

  • Compétence d’analyse d’image : utilise un algorithme de détection d’image pour identifier le contenu d’une image et générer une description texte.

  • Compétence de reconnaissance optique de caractères (OCR) : vous permet d’extraire du texte imprimé ou manuscrit à partir d’images, comme des photos de plaques de rue et des produits, ainsi qu’à partir de documents, comme des factures, des rapports financiers, des articles, etc.