Ajouter un classement sémantique aux requêtes dans Recherche Azure AI

Article
09/27/2024

Vous pouvez appliquer le classement sémantique aux requêtes textuelles, aux requêtes hybrides et aux requêtes vectorielles si vos documents de recherche contiennent des champs de chaîne, et si la requête vectorielle a une représentation textuelle dans le document de recherche.

Cet article explique comment appeler le classeur sémantique sur les requêtes.

Prérequis

Un service de recherche, de niveau Essentiel ou supérieur, disposant du classeur sémantique activé.
Un index de recherche existant avec une configuration sémantique et du contenu de texte enrichi.
Passez en revue Classement sémantique si vous avez besoin d’une introduction à la fonctionnalité.

Remarque

Les légendes et réponses sont extraites du texte littéral du document de recherche. Le sous-système sémantique utilise la compréhension de la lecture automatique pour reconnaître le contenu ayant les caractéristiques d’une légende ou d’une réponse, mais il ne compose pas de nouvelles phrases ou expressions. Pour cette raison, le contenu qui comprend des explications ou des définitions est le mieux adapté au classement sémantique. Si vous voulez une interaction de type conversation avec des réponses générées, consultez RAG (Génération Augmentée de Récupération).

Choisissez un client

Vous pouvez utiliser l’un des outils et SDK suivants pour créer une requête qui utilise le classement sémantique :

Portail Azure, avec le concepteur d’index pour ajouter une configuration sémantique
Visual Studio Code avec un client REST
Kit de développement logiciel (SDK) Azure pour .NET
Kit de développement logiciel (SDK) Azure pour Python
Kit de développement logiciel (SDK) Azure pour Java
Kit de développement logiciel (SDK) pour JavaScript

Éviter les fonctionnalités qui ignorent le score de pertinence

Quelques interrogations des données par requête contournent le scoring de pertinence, ce qui les rend incompatibles avec le classement sémantique. Si la logique de votre requête comprend les fonctionnalités suivantes, vous ne pouvez pas classer sémantiquement vos résultats :

Une requête avec search=* ou une chaîne de recherche vide, comme une requête de filtrage uniquement, ne va pas fonctionner, car il n’y a rien à quoi mesurer la pertinence sémantique. Les scores de la recherche ont ainsi la valeur zéro. La requête doit contenir des expressions ou des termes pouvant être évalués au cours du traitement.
Le tri (clauses orderBy) sur des champs spécifiques l’emporte sur les scores de recherche et un score sémantique. Comme le score sémantique est censé fournir le classement, l’ajout d’une clause orderby entraîne une erreur HTTP 400 si vous appliquez le classement sémantique sur des résultats ordonnés.

Configurer la requête

Dans cette étape, ajoutez des paramètres à la demande de requête. Pour réussir, votre requête doit être une recherche en texte intégral (utilisant le paramètre search pour passer une chaîne) ou une requête vectorielle. L’index doit contenir des champs de texte avec un contenu sémantique riche et une configuration sémantique.

L’Explorateur de recherche inclut des options de classement sémantique.

Connectez-vous au portail Azure.
Ouvrez un index de recherche et sélectionnez Explorateur de recherche.
Sélectionnez Options de requête. Si vous avez déjà défini une configuration sémantique, elle est sélectionnée par défaut. Si vous n’en avez pas, créez une configuration sémantique pour votre index.
Entrez une requête, telle que « hôtel historique avec une bonne nourriture », puis sélectionnez Rechercher.

Vous pouvez également sélectionner Vue JSON et coller des définitions dans l’éditeur de requête :

Voici un texte JSON que vous pouvez coller dans la vue :

 {
     "queryType": "semantic",
     "search": "historic hotel with good food",
     "semanticConfiguration": "my-semantic-config",
     "answers": "extractive|count-3",
     "captions": "extractive|highlight-true",
     "highlightPreTag": "<strong>",
     "highlightPostTag": "</strong>",
     "select": "HotelId,HotelName,Description,Category",
     "count": true
 }

Utilisez Recherche dans des documents pour formuler la demande.

Une réponse inclut automatiquement un @search.rerankerScore. Si vous voulez des légendes ou des réponses dans la réponse retournée, ajoutez des sous-titres et des réponses à la demande.

L’exemple suivant de cette section utilise hotels-sample-index pour montrer le classement sémantique avec des réponses et des légendes sémantiques.

Collez la requête suivante dans un client web en tant que modèle. Remplacez le nom du service et le nom de l’index par des valeurs valides.

POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/search?api-version=2024-07-01      
{
    "queryType": "semantic",
    "search": "newer hotel near the water with a great restaurant",
    "semanticConfiguration": "my-semantic-config",
    "answers": "extractive|count-3",
    "captions": "extractive|highlight-true",
    "highlightPreTag": "<strong>",
    "highlightPostTag": "</strong>",
    "select": "HotelId,HotelName,Description,Category",
    "count": true
}

Définissez « queryType » sur « semantic ».
Définissez la « recherche » sur une requête de recherche en texte intégral. Votre chaîne de recherche peut prendre en charge la syntaxe simple ou la syntaxe Lucene complète. Le classement sémantique étant une extension de la recherche en texte intégral, cette « recherche » n’est pas obligatoire, mais vous n’allez pas obtenir le résultat attendu si sa valeur est une recherche vide ("search": "*").
Définissez « semanticConfiguration » sur une configuration sémantique prédéfinie incorporée dans votre index.
Définissez « answers » pour spécifier si les réponses sémantiques sont incluses dans le résultat. Actuellement, la seule valeur valide pour ce paramètre est extractive. Les réponses peuvent être configurées pour être retournées au nombre de 10 maximum. La valeur par défaut est 1. Cet exemple montre un nombre de trois réponses :extractive|count-3.

Les réponses ne sont pas garanties à chaque demande. Pour obtenir une réponse, la requête doit ressembler à une question, et le contenu doit inclure du texte qui ressemble à une réponse.
Définissez « légendes» si les légendes sémantiques doivent être incluses ou non dans le résultat. Actuellement, la seule valeur valide pour ce paramètre est extractive. Les légendes peuvent être configurées pour renvoyer des résultats avec ou sans surbrillance. Par défaut, les légendes sont renvoyées avec surbrillance. Cet exemple renvoie des légendes sans surbrillance : extractive|highlight-false.

Les légendes et les réponses sont basées sur les champs référencés dans « semanticConfiguration ». Ces champs sont soumis à une limite combinée de l’ordre de 2 000 jetons ou environ 20 000 caractères. Si vous prévoyez un nombre de jetons supérieur à cette limite, envisagez une étape de fractionnement des données en blocs en utilisant la compétence Fractionnement de texte. Cette approche introduit une dépendance vis-à-vis d’un pipeline d’enrichissement par IA et d’indexeurs.
Définissez « highlightPreTag » et « highlightPostTag » si vous souhaitez remplacer la mise en surbrillance par défaut appliquée aux légendes.

Les légendes appliquent le format de surbrillance aux passages importants dans le document qui résument la réponse. Par défaut, il s’agit de <em>. Si vous souhaitez spécifier le type de mise en forme (par exemple un arrière-plan jaune), vous pouvez définir highlightPreTag et highlightPostTag.
Définissez « select » pour spécifier les champs retournés dans la réponse et « count » pour renvoyer le nombre de correspondances dans l’index. Ces paramètres améliorent la qualité de la requête et la lisibilité de la réponse.
Envoyez la demande d’exécution de la requête et retournez les résultats.

Utilisez QueryType ou SemanticQuery pour appeler le classeur sémantique sur une requête sémantique. L’exemple suivant provient de l’équipe SDK Azure.

SearchResults<Hotel> response = await searchClient.SearchAsync<Hotel>(
    "Is there any hotel located on the main commercial artery of the city in the heart of New York?",
    new SearchOptions
    {
        SemanticSearch = new()
        {
            SemanticConfigurationName = "my-semantic-config",
            QueryCaption = new(QueryCaptionType.Extractive),
            QueryAnswer = new(QueryAnswerType.Extractive)
        },
        QueryLanguage = QueryLanguage.EnUs,
        QueryType = SearchQueryType.Semantic
    });

int count = 0;
Console.WriteLine($"Semantic Search Results:");

Console.WriteLine($"\nQuery Answer:");
foreach (QueryAnswerResult result in response.SemanticSearch.Answers)
{
    Console.WriteLine($"Answer Highlights: {result.Highlights}");
    Console.WriteLine($"Answer Text: {result.Text}");
}

await foreach (SearchResult<Hotel> result in response.GetResultsAsync())
{
    count++;
    Hotel doc = result.Document;
    Console.WriteLine($"{doc.HotelId}: {doc.HotelName}");

    if (result.SemanticSearch.Captions != null)
    {
        var caption = result.SemanticSearch.Captions.FirstOrDefault();
        if (caption.Highlights != null && caption.Highlights != "")
        {
            Console.WriteLine($"Caption Highlights: {caption.Highlights}");
        }
        else
        {
            Console.WriteLine($"Caption Text: {caption.Text}");
        }
    }
}
Console.WriteLine($"Total number of search results:{count}");

Évaluer la réponse

Seules les 50 premières correspondances des résultats initiaux peuvent être classées de façon sémantique. Comme pour toutes les requêtes, une réponse est composée de tous les champs marqués comme étant récupérables, ou uniquement des champs listés dans le paramètre select. Une réponse inclut le score de pertinence d’origine et peut également inclure un nombre, ou des résultats par lot, en fonction de la façon dont vous avez formulé la demande.

Dans le classement sémantique, la réponse comporte plus d’éléments : un nouveau score de pertinence classé sémantiquement, une légende facultative en texte brut et mise en évidence ainsi qu’une réponse facultative. Si vos résultats n’incluent pas ces éléments supplémentaires, votre requête peut être mal configurée. Pour résoudre le problème dans un premier temps, vérifiez la configuration sémantique pour vous assurer qu’elle est spécifiée dans la définition d’index et la requête.

Dans une application cliente, vous pouvez structurer la page de recherche pour inclure une légende comme description de la correspondance, plutôt que l’intégralité du contenu d’un champ spécifique. Cette approche est utile lorsque les champs individuels sont trop denses pour la page des résultats de la recherche.

La réponse à la requête ci-dessus retourne la correspondance suivante comme premier choix. Les légendes sont retournées, car la propriété « captions » est définie, avec du texte brut et des versions en surbrillance. Les réponses sont omises de l’exemple, car il n’est pas possible de les déterminer pour cette requête et ce corpus.

"@odata.count": 35,
"@search.answers": [],
"value": [
    {
        "@search.score": 1.8810667,
        "@search.rerankerScore": 1.1446577133610845,
        "@search.captions": [
            {
                "text": "Oceanside Resort. Luxury. New Luxury Hotel. Be the first to stay. Bay views from every room, location near the pier, rooftop pool, waterfront dining & more.",
                "highlights": "<strong>Oceanside Resort.</strong> Luxury. New Luxury Hotel. Be the first to stay.<strong> Bay</strong> views from every room, location near the pier, rooftop pool, waterfront dining & more."
            }
        ],
        "HotelName": "Oceanside Resort",
        "Description": "New Luxury Hotel. Be the first to stay. Bay views from every room, location near the pier, rooftop pool, waterfront dining & more.",
        "Category": "Luxury"
    },
  ...
]

Charges de travail attendues

Pour le classement sémantique, vous devez vous attendre à ce qu’un service de recherche prenne en charge jusqu’à 10 requêtes simultanées par réplica.

Le service limite les requêtes de classement sémantique si les volumes sont trop élevés. Un message d’erreur qui inclut ces expressions indique que le service a atteint sa capacité pour le classement sémantique :

Error in search query: Operation returned an invalid status 'Partial Content'`
@search.semanticPartialResponseReason`
CapacityOverloaded

Si vous prévoyez des exigences de débit cohérentes proches de ce niveau, à ce niveau ou supérieures à ce niveau, envoyez un ticket de support afin que nous puissions approvisionner votre charge de travail.

Étapes suivantes

Le classement sémantique peut être utilisé dans des requêtes hybrides qui combinent la recherche par mot clé et la recherche vectorielle dans une seule requête et une réponse unifiée.

Requête hybride avec classeur sémantique

Partager via