Conserver des données enrichies dans une base de connaissances

Effectué

Une base de connaissances est un stockage persistant de contenus enrichis. L’objectif d’une base de connaissances est de stocker les données générées à partir de l’enrichissement par IA dans un conteneur. Par exemple, vous pouvez enregistrer les résultats d’un ensemble de compétences IA qui génèrent des légendes à partir d’images.

Infographic of knowledge store.

Rappelez-vous que les ensembles de compétences font passer un document à travers une séquence d’enrichissements qui appellent des transformations, comme la reconnaissance d’entités ou la traduction de texte. Le résultat peut être un index de recherche ou des projections dans une base de connaissances. Les deux sorties, index de recherche et base de connaissances, sont des produits du même pipeline. Elles sont dérivées des mêmes entrées mais elles ont pour résultat une sortie structurée, stockée et utilisée dans des applications distinctes.

Bien que l’objectif d’une solution Recherche Azure AI soit généralement de créer un index pouvant faire l’objet de recherches, vous pouvez aussi tirer parti de ses capacités d’extraction et d’enrichissement des données pour conserver les données enrichies dans une base de connaissances en vue d’une analyse ou d’un traitement ultérieur.

Une base de connaissances peut contenir un ou plusieurs des trois types de projections des données extraites :

  • Les projections de table sont utilisées pour structurer les données extraites dans un schéma relationnel pour l’interrogation et la visualisation
  • Les projections d’objet sont des documents JSON qui représentent chaque entité de données
  • Les projections de fichier sont utilisées pour stocker les images extraites au format JPG