Note
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier les répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de changer de répertoire.
Important
L’Assistant Importation de données (nouveau) prend désormais en charge la recherche par mot clé, qui n’était précédemment disponible que dans l’Assistant Importation de données . Nous recommandons le nouvel assistant pour une expérience de recherche améliorée. Pour plus d'informations sur la façon dont nous consolidons les assistants d'importation de données, consultez les assistants d'importation de données dans le portail Azure.
Dans ce guide de démarrage rapide, vous allez utiliser l’Assistant Importer des données (nouveau) et échantillonner des données sur les hôtels fictifs pour créer votre premier index de recherche. L’Assistant ne nécessite aucun code pour créer un index, ce qui vous aide à écrire des requêtes intéressantes en quelques minutes.
L’Assistant crée plusieurs objets sur votre service de recherche, y compris un index pouvant faire l’objet d’une recherche, un indexeur et une connexion de source de données pour la récupération automatisée des données. À la fin de ce guide de démarrage rapide, vous passez en revue chaque objet.
Prérequis
Compte Azure avec un abonnement actif. Créez un compte gratuitement.
Un service de Recherche Azure AI. Créez un service ou recherchez un service existant dans votre abonnement actuel. Vous pouvez utiliser un service gratuit pour ce guide de démarrage rapide.
Un compte de stockage Azure. Utilisez le Stockage Blob Azure ou Azure Data Lake Storage Gen2 (compte de stockage avec un espace de noms hiérarchique), sur un compte de performances standard (v2 à usage général). Pour éviter les frais de bande passante, utilisez la même région qu’Azure AI Search.
Rechercher l’accès réseau
Pour ce guide de démarrage rapide, toutes les ressources précédentes doivent avoir un accès public activé afin que les nœuds du portail Azure puissent y accéder. Sinon, l’Assistant échoue. Une fois l’Assistant exécuté, vous pouvez activer des pare-feux et des points de terminaison privés sur les composants d’intégration à des fins de sécurité. Pour plus d’informations, consultez Connexions sécurisées dans les Assistants d’importation.
Vérifier l’espace disponible
De nombreux clients commencent par un service de recherche gratuit, limité à trois index, trois indexeurs et trois sources de données. Ce guide de démarrage rapide crée un de chaque, donc avant de commencer, assurez-vous d’avoir de la place pour des objets supplémentaires.
Dans la page Vue d’ensemble , sélectionnez Utilisation pour voir le nombre d’index, d’indexeurs et de sources de données dont vous disposez actuellement.
Préparer les données d'échantillon
Ce guide de démarrage rapide utilise un document JSON qui contient des métadonnées pour 50 hôtels fictifs, mais vous pouvez également utiliser vos propres fichiers.
Pour préparer les exemples de données pour ce guide de démarrage rapide :
Téléchargez l’exemple de document JSON.
Connectez-vous au portail Azure et sélectionnez votre compte stockage Azure.
Dans le volet gauche, sélectionnezstockage de données>Conteneurs.
Créez un conteneur nommé hotels-sample.
Chargez le fichier HotelsData_toAzureBlobs.json dans le conteneur.
Démarrer l’Assistant
Pour démarrer l’Assistant de ce démarrage rapide :
Connectez-vous au portail Azure et sélectionnez votre service de recherche.
Dans la page Vue d’ensemble , sélectionnez Importer des données (nouveau).
Sélectionnez votre source de données : Stockage Blob Azure ou Azure Data Lake Storage Gen2.
Sélectionnez Recherche de mot clé.
Créer et charger un index de recherche
Dans cette section, vous allez créer et charger un index en cinq étapes.
Connexion à une source de données
Azure AI Search nécessite une connexion à une source de données pour l’ingestion et l’indexation de contenu. Dans ce cas, la source de données est votre compte stockage Azure.
Pour se connecter aux données d'échantillon :
Dans la page Se connecter à vos données , sélectionnez votre abonnement Azure.
Sélectionnez votre compte de stockage, puis sélectionnez le conteneur hotels-sample .
Sélectionnez un tableau JSON pour le mode d’analyse.
Cliquez sur Suivant.
Ignorer la configuration des compétences
L’Assistant prend en charge la création d’ensembles de compétences et l’enrichissement de l’IA pendant l’indexation, ce qui dépasse l’étendue de ce démarrage rapide. Ignorez cette étape en sélectionnant Suivant.
Conseil
Pour obtenir une procédure pas à pas similaire qui se concentre sur l’enrichissement par IA, consultez Démarrage rapide : Créer un ensemble de compétences dans le portail Azure.
Configurer l’index
En fonction de la structure et du contenu de l'échantillon de données d'hôtel, l'assistant déduit un schéma pour votre index de recherche.
Pour configurer l’index :
Pour chacun des champs suivants, sélectionnez Configurer le champ, puis définissez les attributs respectifs.
Fields Attributes HotelIdClé, récupérable, filtrable, triable, pouvant faire l’objet d’une recherche HotelName,CategoryRécupérable, filtrable, triable, pouvant faire l’objet d’une recherche Description,Description_frRécupérable, pouvant faire l’objet d’une recherche TagsRécupérable, filtrable, pouvant faire l’objet d’une recherche ParkingIncludedIsDeletedLocationRécupérable, filtrable, facettable LastRenovationDate,RatingRécupérable, filtrable, triable Address.StreetAddressRooms.DescriptionRooms.Description_frRécupérable, pouvant faire l’objet d’une recherche Address.City,Address.StateProvince,Address.PostalCode,Address.CountryRécupérable, filtrable, facetable, pouvant faire l’objet d’une recherche, triable Rooms.TypeRooms.BedOptionsRooms.TagsRécupérable, filtrable, facetable, recherchable Rooms.BaseRateRooms.SleepsCountRooms.SmokingAllowedRécupérable, filtrable, facettable Cliquez sur Suivant.
Au minimum, l’index nécessite un nom et une collection de champs. L’Assistant analyse les champs de chaîne uniques et marque un comme clé de document, qui identifie de manière unique chaque document dans l’index.
Chaque champ a un nom, un type de données et des attributs qui contrôlent la façon dont le champ est utilisé dans l’index. Vous pouvez activer ou désactiver les attributs suivants :
| Caractéristique | Descriptif | Types de données applicables |
|---|---|---|
| Récupérable | Champs retournés dans une réponse de requête. | Chaînes et entiers |
| Filtrable | Champs qui acceptent une expression de filtre. | Chaînes et entiers |
| Triable | Champs qui acceptent une expression orderby. | Chaînes et entiers |
| Facetable | Champs utilisés dans une structure de navigation à facettes. | Chaînes et entiers |
| Interrogeable | Champs utilisés dans la recherche en texte intégral. Les chaînes peuvent faire l’objet d’une recherche, mais les champs numériques et booléens sont souvent marqués comme non pouvant faire l’objet d’une recherche. | Chaînes |
Les attributs affectent le stockage de différentes façons. Par exemple, les champs filtrables consomment un stockage supplémentaire, tandis que les champs récupérables ne le sont pas. Pour plus d’informations sur les attributs et les types de données, consultez Configurer les définitions de champs.
Si vous souhaitez effectuer une saisie semi-automatique ou des requêtes suggérées, spécifiez les suggesteurs.
Ignorer les paramètres avancés
L’Assistant propose des paramètres avancés pour le classement sémantique et la planification des index, ce qui dépasse le cadre de ce démarrage rapide. Ignorez cette étape en sélectionnant Suivant.
Examiner et créer les objets
La dernière étape consiste à passer en revue votre configuration et à créer l’index, l’indexeur et la source de données sur votre service de recherche. L’indexeur automatise le processus d’extraction de contenu à partir de votre source de données et le charge dans l’index, ce qui active la recherche par mot clé.
Pour passer en revue et créer les objets :
Remplacez le préfixe du nom de l’objet par hotels-sample.
Passez en revue les configurations d’objet.
L’enrichissement de l’IA, le classement sémantique et la planification de l’indexeur sont soit désactivés, soit définis sur leurs valeurs par défaut, car vous avez ignoré les étapes de l’Assistant.
Sélectionnez Créer pour créer simultanément les objets et exécuter l’indexeur.
Monitorer la progression de l’indexeur
Vous pouvez surveiller la création de l’indexeur et de l’index dans le portail Azure. La page Vue d’ensemble fournit des liens vers les objets créés sur votre service de recherche.
Pour surveiller la progression de l’indexeur :
Dans le volet gauche, sélectionnez Indexeurs.
Recherchez hotels-sample-indexer dans la liste.
La mise à jour des résultats peut prendre quelques minutes. Vous devez voir l’indexeur nouvellement créé avec l’état En cours ou Réussite. La liste indique également le nombre de documents indexés.
Vérifier les résultats de l’index de recherche
Dans le volet gauche, sélectionnez Index.
Sélectionnez hotels-sample-index. Si l’index a zéro document ou stockage, attendez que le portail Azure s’actualise.
Sélectionnez l’onglet Champs pour afficher le schéma d’index.
Vérifiez quels champs sont filtrables ou triables afin de savoir quelles requêtes écrire.
Ajouter ou modifier des champs
Sous l’onglet Champs , vous pouvez créer un champ en sélectionnant Ajouter un champ et en spécifiant un nom, un type de données pris en charge et des attributs.
La modification des champs existants est plus difficile. Les champs existants ont une représentation physique dans l’index de recherche, de sorte qu’ils ne sont pas modifiables, pas même dans le code. Pour modifier fondamentalement un champ existant, vous devez créer un nouveau champ pour remplacer l’original. Vous pouvez ajouter d’autres constructions, telles que des profils de scoring et des options CORS, à un index à tout moment.
Passez en revue les options de définition d’index pour comprendre ce que vous pouvez et ne pouvez pas modifier pendant la conception d’index. Si une option apparaît grisée, vous ne pouvez pas la modifier ou la supprimer.
Exécuter des requêtes avec l’Explorateur de recherche
Vous disposez maintenant d’un index de recherche qui peut être interrogé à l’aide de l’Explorateur de recherche, qui envoie des appels REST conformes aux documents - Publication de recherche (API REST). Cet outil prend en charge la syntaxe de requête simple et la syntaxe complète de requête Lucene pour la recherche de mots clés.
Pour interroger votre index de recherche :
Sous l’onglet Explorateur de recherche, entrez du texte sur lequel effectuer une recherche.
Pour accéder à des zones non invisibles de la sortie, utilisez la mini-carte.
Pour spécifier la syntaxe, basculez vers la vue JSON.
Exemples de requêtes pour l’index hotels-sample
Les exemples suivants supposent la vue JSON et la dernière version de l’API REST en préversion.
Conseil
La vue JSON prend en charge la fonctionnalité Intellisense pour la complétion du nom de paramètre. Placez votre curseur dans la vue JSON et entrez un espace pour afficher la liste de tous les paramètres de requête. Vous pouvez également entrer une lettre, par exemple s, pour afficher uniquement les paramètres de requête qui commencent par cette lettre.
IntelliSense n’exclut pas les paramètres non valides. Utilisez donc votre meilleur jugement.
Exemples de filtres
Le parking, les balises, la date de rénovation, l’évaluation et l’emplacement sont filtrables.
{
"search": "beach OR spa",
"select": "HotelId, HotelName, Description, Rating",
"count": true,
"top": 10,
"filter": "Rating gt 4"
}
Les filtres booléens supposent la valeur « true » par défaut.
{
"search": "beach OR spa",
"select": "HotelId, HotelName, Description, Rating",
"count": true,
"top": 10,
"filter": "ParkingIncluded"
}
La recherche géospatiale est basée sur des filtres. La fonction geo.distance filtre tous les résultats pour les données de position en fonction des coordonnées Location et geography'POINT spécifiées. La requête recherche des hôtels dans les cinq kilomètres des coordonnées -122.12 47.67de latitude et de longitude, qui est « Redmond, Washington, USA ». La requête affiche le nombre total de correspondances &$count=true avec les noms d’hôtel et les emplacements d’adresse.
{
"search": "*",
"select": "HotelName, Address/City, Address/StateProvince",
"count": true,
"top": 10,
"filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}
Exemples complets de syntaxe Lucene
La syntaxe par défaut est une syntaxe simple, mais si vous souhaitez rechercher approximativement, améliorer le terme ou les expressions régulières, spécifiez la syntaxe complète.
{
"queryType": "full",
"search": "seatle~",
"select": "HotelId, HotelName,Address/City, Address/StateProvince",
"count": true
}
Les termes de requête mal orthographiés, comme seatle au lieu de Seattle, ne retournent pas de correspondances dans une recherche classique. Le queryType=full paramètre appelle l’analyseur de requête Lucene complet, qui prend en charge l’opérande tilde (~). Lorsque vous utilisez ces paramètres, la requête effectue une recherche approximative pour le mot clé spécifié et correspond aux termes similaires, mais pas exactement.
Prenez une minute pour essayer ces exemples de requêtes sur votre index. Pour plus d’informations, consultez Querying in Azure AI Search.
Nettoyer les ressources
Lorsque vous travaillez dans votre propre abonnement, nous vous recommandons, à la fin de chaque projet, de déterminer si vous avez toujours besoin des ressources que vous avez créées. Les ressources laissées en cours d’exécution peuvent vous coûter de l’argent. Vous pouvez supprimer les ressources une par une, ou choisir de supprimer le groupe de ressources afin de supprimer l’ensemble des ressources.
Dans le portail Azure, vous pouvez rechercher et gérer des ressources en sélectionnant Toutes les ressources ou groupes de ressources dans le volet gauche.
Remarque
Si vous utilisez un service de recherche gratuit, n’oubliez pas que la limite est de trois index, trois indexeurs et trois sources de données. Vous pouvez supprimer des objets individuels dans le portail Azure pour rester sous la limite.
Étape suivante
Essayez un Assistant du Portail Azure pour générer une application web prête à l’emploi qui s’exécute dans un navigateur. Utilisez cet Assistant sur le petit index que vous avez créé dans ce guide de démarrage rapide ou utilisez des exemples de données pour une expérience de recherche plus riche.