Partager via


Démarrage rapide : Créer un index de recherche dans le portail Azure

Important

L’Assistant Importation de données (nouveau) prend désormais en charge la recherche par mot clé, qui n’était précédemment disponible que dans l’Assistant Importation de données . Nous recommandons le nouvel assistant pour une expérience de recherche améliorée. Pour plus d'informations sur la façon dont nous consolidons les assistants d'importation de données, consultez les assistants d'importation de données dans le portail Azure.

Dans ce guide de démarrage rapide, vous allez utiliser l’Assistant Importer des données (nouveau) et échantillonner des données sur les hôtels fictifs pour créer votre premier index de recherche. L’Assistant ne nécessite aucun code pour créer un index, ce qui vous aide à écrire des requêtes intéressantes en quelques minutes.

L’Assistant crée plusieurs objets sur votre service de recherche, y compris un index pouvant faire l’objet d’une recherche, un indexeur et une connexion de source de données pour la récupération automatisée des données. À la fin de ce guide de démarrage rapide, vous passez en revue chaque objet.

Prérequis

  • Compte Azure avec un abonnement actif. Créez un compte gratuitement.

  • Un service de Recherche Azure AI. Créez un service ou recherchez un service existant dans votre abonnement actuel. Vous pouvez utiliser un service gratuit pour ce guide de démarrage rapide.

  • Un compte de stockage Azure. Utilisez le Stockage Blob Azure ou Azure Data Lake Storage Gen2 (compte de stockage avec un espace de noms hiérarchique), sur un compte de performances standard (v2 à usage général). Pour éviter les frais de bande passante, utilisez la même région qu’Azure AI Search.

Rechercher l’accès réseau

Pour ce guide de démarrage rapide, toutes les ressources précédentes doivent avoir un accès public activé afin que les nœuds du portail Azure puissent y accéder. Sinon, l’Assistant échoue. Une fois l’Assistant exécuté, vous pouvez activer des pare-feux et des points de terminaison privés sur les composants d’intégration à des fins de sécurité. Pour plus d’informations, consultez Connexions sécurisées dans les Assistants d’importation.

Vérifier l’espace disponible

De nombreux clients commencent par un service de recherche gratuit, limité à trois index, trois indexeurs et trois sources de données. Ce guide de démarrage rapide crée un de chaque, donc avant de commencer, assurez-vous d’avoir de la place pour des objets supplémentaires.

Dans la page Vue d’ensemble , sélectionnez Utilisation pour voir le nombre d’index, d’indexeurs et de sources de données dont vous disposez actuellement.

Capture d’écran de la page Vue d’ensemble pour une instance de service Recherche Azure AI dans le portail Azure, affichant le nombre d’index, d’indexeurs et de sources de données.

Préparer les données d'échantillon

Ce guide de démarrage rapide utilise un document JSON qui contient des métadonnées pour 50 hôtels fictifs, mais vous pouvez également utiliser vos propres fichiers.

Pour préparer les exemples de données pour ce guide de démarrage rapide :

  1. Téléchargez l’exemple de document JSON.

  2. Connectez-vous au portail Azure et sélectionnez votre compte stockage Azure.

  3. Dans le volet gauche, sélectionnezstockage de données>Conteneurs.

  4. Créez un conteneur nommé hotels-sample.

  5. Chargez le fichier HotelsData_toAzureBlobs.json dans le conteneur.

Démarrer l’Assistant

Pour démarrer l’Assistant de ce démarrage rapide :

  1. Connectez-vous au portail Azure et sélectionnez votre service de recherche.

  2. Dans la page Vue d’ensemble , sélectionnez Importer des données (nouveau).

    Capture d’écran montrant comment ouvrir le nouvel Assistant Importation dans le portail Azure.

  3. Sélectionnez votre source de données : Stockage Blob Azure ou Azure Data Lake Storage Gen2.

    Capture d’écran des options de sélection d’une source de données dans l’Assistant.

  4. Sélectionnez Recherche de mot clé.

    Capture d’écran de la vignette de recherche de mots clés dans le portail Azure.

Créer et charger un index de recherche

Dans cette section, vous allez créer et charger un index en cinq étapes.

Connexion à une source de données

Azure AI Search nécessite une connexion à une source de données pour l’ingestion et l’indexation de contenu. Dans ce cas, la source de données est votre compte stockage Azure.

Pour se connecter aux données d'échantillon :

  1. Dans la page Se connecter à vos données , sélectionnez votre abonnement Azure.

  2. Sélectionnez votre compte de stockage, puis sélectionnez le conteneur hotels-sample .

  3. Sélectionnez un tableau JSON pour le mode d’analyse.

    Capture d’écran de la page Se connecter à vos données dans le portail Azure.

  4. Cliquez sur Suivant.

Ignorer la configuration des compétences

L’Assistant prend en charge la création d’ensembles de compétences et l’enrichissement de l’IA pendant l’indexation, ce qui dépasse l’étendue de ce démarrage rapide. Ignorez cette étape en sélectionnant Suivant.

Conseil

Pour obtenir une procédure pas à pas similaire qui se concentre sur l’enrichissement par IA, consultez Démarrage rapide : Créer un ensemble de compétences dans le portail Azure.

Configurer l’index

En fonction de la structure et du contenu de l'échantillon de données d'hôtel, l'assistant déduit un schéma pour votre index de recherche.

Pour configurer l’index :

  1. Pour chacun des champs suivants, sélectionnez Configurer le champ, puis définissez les attributs respectifs.

    Fields Attributes
    HotelId Clé, récupérable, filtrable, triable, pouvant faire l’objet d’une recherche
    HotelName, Category Récupérable, filtrable, triable, pouvant faire l’objet d’une recherche
    Description, Description_fr Récupérable, pouvant faire l’objet d’une recherche
    Tags Récupérable, filtrable, pouvant faire l’objet d’une recherche
    ParkingIncluded IsDeleted Location Récupérable, filtrable, facettable
    LastRenovationDate, Rating Récupérable, filtrable, triable
    Address.StreetAddress Rooms.Description Rooms.Description_fr Récupérable, pouvant faire l’objet d’une recherche
    Address.City, Address.StateProvince, Address.PostalCode, Address.Country Récupérable, filtrable, facetable, pouvant faire l’objet d’une recherche, triable
    Rooms.Type Rooms.BedOptions Rooms.Tags Récupérable, filtrable, facetable, recherchable
    Rooms.BaseRate Rooms.SleepsCount Rooms.SmokingAllowed Récupérable, filtrable, facettable

    GIF qui montre comment configurer des attributs pour les champs de l’index.

  2. Cliquez sur Suivant.

Au minimum, l’index nécessite un nom et une collection de champs. L’Assistant analyse les champs de chaîne uniques et marque un comme clé de document, qui identifie de manière unique chaque document dans l’index.

Chaque champ a un nom, un type de données et des attributs qui contrôlent la façon dont le champ est utilisé dans l’index. Vous pouvez activer ou désactiver les attributs suivants :

Caractéristique Descriptif Types de données applicables
Récupérable Champs retournés dans une réponse de requête. Chaînes et entiers
Filtrable Champs qui acceptent une expression de filtre. Chaînes et entiers
Triable Champs qui acceptent une expression orderby. Chaînes et entiers
Facetable Champs utilisés dans une structure de navigation à facettes. Chaînes et entiers
Interrogeable Champs utilisés dans la recherche en texte intégral. Les chaînes peuvent faire l’objet d’une recherche, mais les champs numériques et booléens sont souvent marqués comme non pouvant faire l’objet d’une recherche. Chaînes

Les attributs affectent le stockage de différentes façons. Par exemple, les champs filtrables consomment un stockage supplémentaire, tandis que les champs récupérables ne le sont pas. Pour plus d’informations sur les attributs et les types de données, consultez Configurer les définitions de champs.

Si vous souhaitez effectuer une saisie semi-automatique ou des requêtes suggérées, spécifiez les suggesteurs.

Ignorer les paramètres avancés

L’Assistant propose des paramètres avancés pour le classement sémantique et la planification des index, ce qui dépasse le cadre de ce démarrage rapide. Ignorez cette étape en sélectionnant Suivant.

Examiner et créer les objets

La dernière étape consiste à passer en revue votre configuration et à créer l’index, l’indexeur et la source de données sur votre service de recherche. L’indexeur automatise le processus d’extraction de contenu à partir de votre source de données et le charge dans l’index, ce qui active la recherche par mot clé.

Pour passer en revue et créer les objets :

  1. Remplacez le préfixe du nom de l’objet par hotels-sample.

  2. Passez en revue les configurations d’objet.

    Capture d’écran de la page de configuration d’objet dans le portail Azure.

    L’enrichissement de l’IA, le classement sémantique et la planification de l’indexeur sont soit désactivés, soit définis sur leurs valeurs par défaut, car vous avez ignoré les étapes de l’Assistant.

  3. Sélectionnez Créer pour créer simultanément les objets et exécuter l’indexeur.

Monitorer la progression de l’indexeur

Vous pouvez surveiller la création de l’indexeur et de l’index dans le portail Azure. La page Vue d’ensemble fournit des liens vers les objets créés sur votre service de recherche.

Pour surveiller la progression de l’indexeur :

  1. Dans le volet gauche, sélectionnez Indexeurs.

  2. Recherchez hotels-sample-indexer dans la liste.

    Capture d’écran montrant la création de l’indexeur en cours dans le portail Azure.

    La mise à jour des résultats peut prendre quelques minutes. Vous devez voir l’indexeur nouvellement créé avec l’état En cours ou Réussite. La liste indique également le nombre de documents indexés.

Vérifier les résultats de l’index de recherche

  1. Dans le volet gauche, sélectionnez Index.

  2. Sélectionnez hotels-sample-index. Si l’index a zéro document ou stockage, attendez que le portail Azure s’actualise.

    Capture d’écran de la liste Indexes sur le tableau de bord du service Recherche d’IA Azure dans le portail Azure.

  3. Sélectionnez l’onglet Champs pour afficher le schéma d’index.

  4. Vérifiez quels champs sont filtrables ou triables afin de savoir quelles requêtes écrire.

    Capture d’écran montrant la définition de schéma d’un index dans le service Recherche d’IA Azure dans le portail Azure.

Ajouter ou modifier des champs

Sous l’onglet Champs , vous pouvez créer un champ en sélectionnant Ajouter un champ et en spécifiant un nom, un type de données pris en charge et des attributs.

La modification des champs existants est plus difficile. Les champs existants ont une représentation physique dans l’index de recherche, de sorte qu’ils ne sont pas modifiables, pas même dans le code. Pour modifier fondamentalement un champ existant, vous devez créer un nouveau champ pour remplacer l’original. Vous pouvez ajouter d’autres constructions, telles que des profils de scoring et des options CORS, à un index à tout moment.

Passez en revue les options de définition d’index pour comprendre ce que vous pouvez et ne pouvez pas modifier pendant la conception d’index. Si une option apparaît grisée, vous ne pouvez pas la modifier ou la supprimer.

Exécuter des requêtes avec l’Explorateur de recherche

Vous disposez maintenant d’un index de recherche qui peut être interrogé à l’aide de l’Explorateur de recherche, qui envoie des appels REST conformes aux documents - Publication de recherche (API REST). Cet outil prend en charge la syntaxe de requête simple et la syntaxe complète de requête Lucene pour la recherche de mots clés.

Pour interroger votre index de recherche :

  1. Sous l’onglet Explorateur de recherche, entrez du texte sur lequel effectuer une recherche.

    Capture d’écran montrant comment entrer et exécuter une requête dans l’outil Explorateur de recherche.

  2. Pour accéder à des zones non invisibles de la sortie, utilisez la mini-carte.

    Capture d’écran montrant les résultats longs d’une requête dans l’outil Explorateur de recherche et la mini-carte.

  3. Pour spécifier la syntaxe, basculez vers la vue JSON.

    Capture d’écran du sélecteur de vue JSON.

Exemples de requêtes pour l’index hotels-sample

Les exemples suivants supposent la vue JSON et la dernière version de l’API REST en préversion.

Conseil

La vue JSON prend en charge la fonctionnalité Intellisense pour la complétion du nom de paramètre. Placez votre curseur dans la vue JSON et entrez un espace pour afficher la liste de tous les paramètres de requête. Vous pouvez également entrer une lettre, par exemple s, pour afficher uniquement les paramètres de requête qui commencent par cette lettre.

IntelliSense n’exclut pas les paramètres non valides. Utilisez donc votre meilleur jugement.

Exemples de filtres

Le parking, les balises, la date de rénovation, l’évaluation et l’emplacement sont filtrables.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

Les filtres booléens supposent la valeur « true » par défaut.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

La recherche géospatiale est basée sur des filtres. La fonction geo.distance filtre tous les résultats pour les données de position en fonction des coordonnées Location et geography'POINT spécifiées. La requête recherche des hôtels dans les cinq kilomètres des coordonnées -122.12 47.67de latitude et de longitude, qui est « Redmond, Washington, USA ». La requête affiche le nombre total de correspondances &$count=true avec les noms d’hôtel et les emplacements d’adresse.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

Exemples complets de syntaxe Lucene

La syntaxe par défaut est une syntaxe simple, mais si vous souhaitez rechercher approximativement, améliorer le terme ou les expressions régulières, spécifiez la syntaxe complète.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

Les termes de requête mal orthographiés, comme seatle au lieu de Seattle, ne retournent pas de correspondances dans une recherche classique. Le queryType=full paramètre appelle l’analyseur de requête Lucene complet, qui prend en charge l’opérande tilde (~). Lorsque vous utilisez ces paramètres, la requête effectue une recherche approximative pour le mot clé spécifié et correspond aux termes similaires, mais pas exactement.

Prenez une minute pour essayer ces exemples de requêtes sur votre index. Pour plus d’informations, consultez Querying in Azure AI Search.

Nettoyer les ressources

Lorsque vous travaillez dans votre propre abonnement, nous vous recommandons, à la fin de chaque projet, de déterminer si vous avez toujours besoin des ressources que vous avez créées. Les ressources laissées en cours d’exécution peuvent vous coûter de l’argent. Vous pouvez supprimer les ressources une par une, ou choisir de supprimer le groupe de ressources afin de supprimer l’ensemble des ressources.

Dans le portail Azure, vous pouvez rechercher et gérer des ressources en sélectionnant Toutes les ressources ou groupes de ressources dans le volet gauche.

Remarque

Si vous utilisez un service de recherche gratuit, n’oubliez pas que la limite est de trois index, trois indexeurs et trois sources de données. Vous pouvez supprimer des objets individuels dans le portail Azure pour rester sous la limite.

Étape suivante

Essayez un Assistant du Portail Azure pour générer une application web prête à l’emploi qui s’exécute dans un navigateur. Utilisez cet Assistant sur le petit index que vous avez créé dans ce guide de démarrage rapide ou utilisez des exemples de données pour une expérience de recherche plus riche.