Démarrage rapide : Créer un index de recherche dans le portail Azure

Dans ce guide de démarrage rapide Recherche d’IA Azure, créez votre premier index de recherche à l’aide de l’Assistant Importation de données et d’une source de données intégrée composée de données d’hôtel fictifs hébergées par Microsoft. L’Assistant vous guide tout au long de la création d’un index de recherche sans code pour vous aider à écrire des requêtes intéressantes en quelques minutes.

L’Assistant crée plusieurs objets sur votre service de recherche , index pouvant faire l’objet d’une recherche, mais également d’une connexion d’indexeur et de source de données pour la récupération automatisée des données. À la fin de ce guide de démarrage rapide, nous examinons chaque objet.

Remarque

L’Assistant Importation de données inclut des options pour l’OCR, la traduction de texte et d’autres enrichissements ia qui ne sont pas abordés dans ce guide de démarrage rapide. Pour obtenir une procédure pas à pas similaire qui se concentre sur l’enrichissement par IA, consultez Démarrage rapide : Créer un ensemble de compétences dans le Portail Azure.

Prérequis

Vérifier l’espace disponible

De nombreux clients commencent avec le service gratuit. Ce niveau gratuit est limité à trois index, trois sources de données et trois indexeurs. Avant de commencer, assurez-vous de disposer d’assez d’espace pour stocker des éléments supplémentaires. Ce guide de démarrage rapide crée une occurrence de chaque objet.

Consultez l’onglet Vue d’ensemble > de l’utilisation du service pour voir le nombre d’index, d’indexeurs et de sources de données dont vous disposez déjà.

Screenshot of the Overview page for an Azure AI Search service instance in the Azure portal, showing the number of indexes, indexers, and data sources.

Démarrer l’Assistant

  1. Connectez-vous au portail Azure avec votre compte Azure, puis accédez à votre service Azure AI Search.

  2. Dans la page Vue d’ensemble, sélectionnez Importer des données pour démarrer l’Assistant.

    Screenshot that shows how to open the Import data wizard in the Azure portal.

Créer et charger un index

Dans cette section, créez et chargez un index en quatre étapes.

Se connecter à une source de données

L’Assistant crée une connexion de source de données à des exemples de données hébergés par Microsoft sur Azure Cosmos DB. Cet exemple de données est récupéré via une connexion interne. Vous n’avez pas besoin de votre propre compte Ou fichiers sources Azure Cosmos DB pour exécuter ce guide de démarrage rapide.

  1. Sur Connecter à vos données, développez la liste déroulante Source de données et sélectionnez Exemples.

  2. Dans la liste des exemples intégrés, sélectionnez hotels-sample.

    Screenshot that shows how to select the hotels-sample data source in the Import data wizard.

  3. Sélectionnez Suivant : Ajouter des compétences cognitives (facultatif) pour continuer.

Ignorer la configuration des compétences cognitives

L’Assistant Importation de données prend en charge la création d’un ensemble de compétences et l’enrichissement par IA dans l’indexation.

  1. Pour ce démarrage rapide, ignorez les options de configuration de l’enrichissement par IA sous l’onglet Ajouter des compétences cognitives.

  2. Sélectionnez Passer à : Personnaliser l’index cible pour continuer.

    Screenshot that shows how to Skip to the Customize target index tab in the Import data wizard.

Conseil

Vous êtes intéressé par l’enrichissement par IA ? Essayez ce guide de démarrage rapide : Créer un ensemble de compétences dans le Portail Azure

Configurer l’index

L’Assistant déduit un schéma pour l’index intégré hotels-sample. Procédez comme suit pour configurer l’index :

  1. Acceptez les valeurs générées par le système pour le nom de l’index (hotels-sample-index) et le champ Clé (HotelId).

  2. Acceptez les valeurs générées par le système pour tous les attributs de champ.

    Important

    Si vous réexécutez l’assistant et utilisez une source de données « hotels-sample » existante, l’index n’est pas configuré avec les attributs par défaut. Vous devez sélectionner manuellement les attributs lors des prochaines importations.

  3. Sélectionnez Suivant : Créer un indexeur pour continuer.

Screenshot that shows the generated index definition for the hotels-sample data source in the Import data wizard.

Au minimum, l’index nécessite un nom d’index et une collection de champs. Un champ doit être marqué comme clé de document pour identifier chaque document de façon unique. La valeur est toujours une chaîne. L’Assistant analyse les champs de chaîne uniques et en choisit un pour la clé.

Chaque champ a un nom, un type de données et des attributs qui contrôlent l’utilisation du champ dans l’index de recherche. Les cases à cocher activent ou désactivent les attributs suivants :

  • Récupérable : champs retournés dans une réponse de requête.
  • Filtrable : champs qui acceptent une expression de filtre.
  • Triable : champs qui acceptent une expression orderby.
  • Facetable : champs utilisés dans une structure de navigation à facettes.
  • Pouvant faire l’objet d’une recherche : champs utilisés dans la recherche en texte intégral. Les chaînes sont utilisables dans une recherche. Les champs numériques et booléens sont souvent marqués comme ne pouvant pas faire l’objet d’une recherche.

Les chaînes sont dotées des attributs Récupérable et Possibilité de recherche. Les entiers sont dotés des attributs Récupérable, Filtrable, Triable et À choix multiples.

Les attributs affectent le stockage. Les champs filtrables consomment un stockage supplémentaire, mais il n’est pas récupérable . Pour plus d’informations, consultez la section Exemple illustrant les implications de stockage des attributs et des générateurs de suggestions.

Si vous souhaitez effectuer une saisie semi-automatique ou des requêtes suggérées, spécifiez des analyseurs de langage ou des suggesteurs.

Configurer et exécuter l’indexeur

La dernière étape configure et exécute l’indexeur. Cet objet définit un processus exécutable. La source de données, l’index et l’indexeur sont créés à cette étape.

  1. Acceptez la valeur générée par le système pour le nom de l’indexeur (hotels-sample-indexer).

  2. Pour ce démarrage rapide, utilisez l’option par défaut pour exécuter l’indexeur une seule fois, immédiatement. Les données hébergées sont statiques de sorte qu’aucun suivi des modifications n’est activé pour celui-ci.

  3. Sélectionnez Envoyer pour créer et exécuter simultanément l’indexeur.

    Screenshot that shows how to configure the indexer for the hotels-sample data source in the Import data wizard.

Surveiller la progression de l’indexeur

Vous pouvez surveiller la création de l’indexeur ou de l’index dans le portail. La page Vue d’ensemble du service contient des liens vers les ressources créées dans votre service Recherche Azure AI.

  1. Sur la gauche, sélectionnez Indexeurs.

    Screenshot that shows the creation of the indexer in progress in the Azure portal.

    La mise à jour des résultats de la page sur le portail Azure peut prendre quelques minutes. Vous devez voir l’indexeur nouvellement créé dans la liste avec l’état En cours ou Succès. La liste indique également le nombre de documents indexés.

Vérifier les résultats de l’index de recherche

  1. Sur la gauche, sélectionnez Index.

  2. Sélectionnez hotels-sample-index.

    Attendez que la page du portail Azure s’actualise. Vous devriez voir l’index avec un nombre de documents et une taille de stockage.

    Screenshot of the Indexes list on the Azure AI Search service dashboard in the Azure portal.

  3. Sélectionnez l’onglet Champs pour afficher le schéma d’index.

    Vérifiez quels champs sont filtrables ou triables pour connaître les requêtes à écrire.

    Screenshot that shows the schema definition for an index in the Azure AI Search service in the Azure portal.

Ajouter ou modifier des champs

Sous l’onglet Champs, vous pouvez créer un champ à l’aide de l’option Ajouter un champ avec un nom, un type de données pris en charge et des attributions.

La modification des champs existants est plus difficile. Les champs existants ont une représentation physique dans l’index afin qu’ils ne soient pas modifiables, pas même dans le code. Pour modifier fondamentalement un champ existant, vous devez créer un nouveau champ qui remplace l’original. D’autres constructions, telles que les profils de scoring et les options CORS, peuvent être ajoutées à un index à tout moment.

Pour comprendre clairement ce que vous pouvez et ne pouvez pas modifier lors de la conception d’index, prenez une minute pour consulter les options de définition d’index. Les options grisées dans la liste des champs indiquent des valeurs qui ne peuvent pas être modifiées ou supprimées.

Exécuter des requêtes avec l’Explorateur de recherche

Vous disposez maintenant d’un index de recherche qui peut être interrogé avec l’Explorateur de recherche. L’Explorateur de recherche envoie des appels REST conformes à l’API REST SEARCH POST. L’outil prend en charge la syntaxe de requêtes simples et la syntaxe de requêtes Lucene complètes.

  1. Sous l’onglet Explorateur de recherche, entrez du texte sur lequel effectuer une recherche.

    Screenshot that shows how to enter and run a query in the Search Explorer tool.

  2. Utilisez la mini-carte pour passer rapidement à des zones non invisibles de la sortie.

    Screenshot that shows long results for a query in the Search Explorer tool and the mini-map.

  3. Pour spécifier la syntaxe, basculez vers la vue JSON.

    Screenshot of the JSON view selector.

Exemples de requêtes pour l’exemple d’index d’hôtels

Les exemples suivants supposent la vue JSON et la version de l’API REST 2023-11-01.

Exemples de filtres

Parking, balises, date de rénovation, évaluation et emplacement sont filtrables.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

Les filtres booléens supposent « true » par défaut.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

La recherche géospatiale est basée sur des filtres. La geo.distance fonction filtre tous les résultats des données positionnelles en fonction des coordonnées et geography'POINT des coordonnées spécifiéesLocation. La requête recherche des hôtels qui se trouvent à moins de 5 kilomètres des coordonnées -122.12 47.67de longitude de latitude , qui est « Redmond, Washington, États-Unis ». La requête affiche le nombre total de correspondances &$count=true avec les noms d’hôtels et les adresses.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

Exemples complets de syntaxe Lucene

La syntaxe par défaut est une syntaxe simple, mais si vous souhaitez une recherche approximative ou une amélioration de terme ou des expressions régulières, spécifiez la syntaxe complète.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

Par défaut, dans une recherche classique, aucune correspondance n’est retournée pour les termes de requête mal orthographiés, par exemple seatle pour Seattle. Le paramètre queryType=full appelle l’analyseur de requête Lucene complet, qui prend en charge l’opérande ~ tilde. Lorsque ces paramètres sont présents, la requête effectue une recherche approximative pour le mot clé spécifié. La requête recherche des résultats correspondants ainsi que des résultats qui sont similaires au mot clé, mais qui ne correspondent pas exactement à celui-ci.

Prenez une minute pour essayer quelques-uns de ces exemples de requêtes pour votre index. Pour en savoir plus sur les requêtes, consultez Interrogation dans Recherche IA Azure.

Nettoyer les ressources

Lorsque vous travaillez dans votre propre abonnement, il est recommandé, à la fin de chaque projet, de déterminer si vous avez toujours besoin des ressources que vous avez créées. Les ressources laissées en cours d’exécution peuvent vous coûter de l’argent. Vous pouvez supprimer les ressources une par une ou supprimer le groupe de ressources.

Vous pouvez rechercher et gérer les ressources pour votre service sur le portail Azure sous Toutes les ressources ou Groupes de ressources situés dans le volet de gauche.

Si vous utilisez un service gratuit, n’oubliez pas que la limite est de trois index, indexeurs et sources de données. Vous pouvez supprimer des éléments un par un sur le portail Azure pour ne pas dépasser la limite.

Étapes suivantes

Essayez un assistant du portail Azure pour générer une application web prête à l’emploi qui s’exécute dans un navigateur. Utilisez cet assistant sur le petit index que vous avez créé dans ce démarrage rapide ou utiliser l’un des exemples de jeux de données intégrés pour une expérience de recherche plus riche.