Utiliser un indexeur pour créer un index

Effectué

Pour pouvoir indexer les documents dans Stockage Azure, vous devez les exporter à partir de leur type de fichier d’origine vers JSON. Pour exporter des données de n’importe quel format vers JSON et les charger dans un index, nous utilisons un indexeur.

Pour créer des documents de recherche, vous pouvez générer des documents JSON avec le code d’application ou vous pouvez utiliser l’indexeur d’Azure pour exporter des documents entrants dans JSON.

La Recherche Azure AI vous permet de créer et de charger des documents JSON dans un index avec deux approches :

  • Méthode d’envoi (push) : Les données JSON sont envoyées (push) à un index de recherche par le biais de l’API REST ou du SDK .NET. Cette approche offre la plus grande souplesse, car elle n’impose aucune restriction quant au type, à l’emplacement ou à la fréquence d’exécution de la source de données.

  • Méthode de tirage (pull) : Les indexeurs de service de recherche peuvent extraire des données à partir de sources de données Azure populaires et, si nécessaire, exporter ces données dans JSON si elles ne sont pas déjà dans ce format.

Utiliser la méthode de tirage (pull) pour charger des données avec un indexeur

L’indexeur de la Recherche Azure AI est un robot qui extrait le texte et les métadonnées pouvant faire l’objet d’une recherche à partir d’une source de données Azure externe et remplit un index de recherche à l’aide de mappages champ-champ entre les données sources et votre index. L’utilisation de l’indexeur est parfois appelée approche « modèle de tirage (pull) », car le service extrait des données sans que vous ayez à écrire du code qui ajoute des données à un index. Un indexeur mappe les champs sources aux champs correspondants de l’index.

Supervision et vérification de l’importation des données

La page de vue d’ensemble du service de recherche comprend un tableau de bord qui vous permet d’avoir un aperçu rapide de l’intégrité du service de recherche. Dans le tableau de bord, vous pouvez voir le nombre de documents dans le service de recherche, le nombre d’index qui ont été utilisés et la quantité de stockage en cours d’utilisation.

Lors du chargement de nouveaux documents dans un index, vous pouvez superviser la progression en cliquant sur l’indexeur associé à l’index. Le nombre de documents augmente à mesure que les documents sont chargés dans l’index. Dans certains cas, plusieurs minutes peuvent s’écouler avant l’affichage du nombre de documents actualisé dans la page du portail. Une fois que l’index est prêt pour l’interrogation, vous pouvez utiliser l’Explorateur de recherche pour vérifier les résultats. Un index est prêt quand le premier document est correctement chargé.

Les indexeurs importent uniquement les nouveaux documents et ceux mis à jour ; ainsi, il est normal de voir zéro document indexé.

Vous pouvez utiliser l’Explorateur de recherche pour effectuer des recherches rapides et vérifier le contenu d’un index et que les résultats des recherches correspondent à vos attentes. Disponible dans le portail, cet outil vous permet de vérifier l’index facilement en passant en revue les résultats qui sont retournés sous la forme de documents JSON.

Apporter des modifications à un index

Vous devez supprimer et recréer l’index si vous avez besoin d’apporter des modifications aux définitions des champs. L’ajout de nouveaux champs à un document existant est pris en charge ; ils sont alors renseignés avec des valeurs Null. Il est plus rapide d’utiliser une approche basée sur du code pour effectuer une itération au sein de vos conceptions, car le recours au portail nécessite de supprimer et recréer l’index et de fournir manuellement les détails du schéma.

Une approche pour mettre à jour un index sans incidence sur vos utilisateurs consiste à créer un index sous un nom différent. Vous pouvez utiliser le même indexeur et la même source de données. Après avoir importé des données, vous pouvez configurer votre application pour qu’elle utilise le nouvel index.