Comprendre les index

Effectué

Un index Recherche Azure AI peut être considéré comme un conteneur de documents pouvant faire l’objet d’une recherche. Conceptuellement, vous pouvez considérer un index comme une table, où chaque ligne de la table représente un document. Les tables ont des colonnes, qui peuvent être considérées comme l’équivalent des champs dans un document. Les colonnes ont des types de données, tout comme les champs dans les documents.

Schéma d’index

Dans Recherche Azure AI, un index est une collection permanente de documents JSON et d’autres contenus utilisés pour permettre la fonctionnalité de recherche. Les documents au sein d’un index peuvent être considérés comme les lignes d’une table, chaque document étant une unité unique de données pouvant faire l’objet d’une recherche dans l’index.

L’index inclut une définition de la structure des données de ces documents, appelée son schéma. Voici un exemple de schéma d’index avec des champs keyphrases et imageTags extraits par IA :

A screenshot of the structure of an index schema in json including key phrases and image tags.

Attributs d’index

La Recherche Azure AI doit savoir comment vous voulez effectuer des recherches et afficher les champs dans les documents. Vous spécifiez cela en affectant des attributs, ou comportements, à ces champs. Pour chaque champ du document, l’index stocke son nom, le type de données et les comportements pris en charge pour le champ tels que : est-ce que le champ peut faire l’objet d’une recherche, puis-je trier le champ ?

Les index les plus efficaces utilisent uniquement les comportements qui sont nécessaires. Si vous oubliez de définir un comportement requis sur un champ lors de la conception, la seule façon d’obtenir cette fonctionnalité consiste à regénérer l’index.

L’image suivante montre les champs lors de la conception d’un index dans Azure :

Screenshot showing an example index with different fields.