Identifier les éléments d’une solution de recherche

Effectué

Infographic of indexing process.

Une solution Recherche Azure AI classique commence par une source de données qui contient les artefacts de données que vous souhaitez rechercher. Il peut s’agir d’une hiérarchie de dossiers et de fichiers dans le stockage Azure, ou de texte dans une base de données comme Azure SQL Database ou Azure Cosmos DB. Le format de données pris en charge par Recherche Azure AI est JSON. Quelle que soit l’origine de vos données, si vous pouvez les fournir en tant que document JSON, le moteur de recherche peut les indexer.

Si vos données résident dans une source de données prise en charge, vous pouvez utiliser un indexeur pour automatiser l’ingestion des données, y compris la sérialisation JSON des données sources dans des formats natifs. Un indexeur se connecte à une source de données, sérialise les données et les passe au moteur de recherche pour l’indexation. La plupart des indexeurs prennent en charge la détection des modifications, ce qui simplifie l’actualisation des données.

Outre l’automatisation de l’ingestion des données, les indexeurs prennent également en charge l’enrichissement par IA. Vous pouvez attacher un ensemble de compétences qui applique une séquence de compétences en IA pour enrichir les données, permettant de faciliter la recherche au sein de ces données. Un ensemble complet de compétences intégrées, basées sur les API des services Azure AI, peut vous aider à dériver de nouveaux champs. Par exemple, en reconnaissant des entités dans un texte, en traduisant un texte, en évaluant le sentiment ou en prédisant des légendes appropriées pour les images. Si vous le souhaitez, le contenu enrichi peut être envoyé à une base de connaissances qui stocke la sortie d’un pipeline d’enrichissement par IA dans des tables et des objets blob de stockage Azure pour une analyse indépendante ou un traitement en aval.

Que vous écriviez du code d’application qui envoie des données à un index ou utilisiez un indexeur qui automatise l’ingestion des données et ajoute l’enrichissement par IA, les champs contenant votre contenu sont conservés dans un index, qui peut faire l’objet de recherches par des applications clientes. Les champs sont utilisés pour la recherche, le filtrage et le tri de façon à générer un jeu de résultats qui peut être affiché ou utilisé par l’application cliente.