Semantische rangschikking configureren en onderschrift s retourneren in zoekresultaten

In dit artikel leert u hoe u een semantische rangschikking aanroept boven een resultatenset, waardoor de meest semantisch relevante resultaten boven aan de stapel worden gepromoot. U kunt ook semantische onderschrift s krijgen, met hoogtepunten over de meest relevante termen en woordgroepen en semantische antwoorden.

Vereisten

  • Een zoekservice op de Basic-, Standard-laag (S1, S2, S3) of de laag Geoptimaliseerd voor opslag (L1, L2), afhankelijk van de beschikbaarheid van regio's.

  • Semantische rangschikking ingeschakeld voor uw zoekservice.

  • Een bestaande zoekindex met inhoud met tekst met opmaak. Semantische rangschikking is van toepassing op tekstvelden (nonvector) en werkt het beste voor inhoud die informatief of beschrijvend is.

Een client kiezen

Kies een zoekclient die ondersteuning biedt voor semantische classificatie. Hieronder volgen een aantal opties:

Een semantische configuratie toevoegen

Een semantische configuratie is een sectie in uw index waarmee veldinvoer voor semantische classificatie wordt vastgesteld. U kunt op elk gewenst moment een semantische configuratie toevoegen of bijwerken, zonder dat u deze opnieuw hoeft te bouwen. Als u meerdere configuraties maakt, kunt u een standaard opgeven. Geef tijdens query's een semantische configuratie op voor een queryaanvraag of laat deze leeg om de standaardinstelling te gebruiken.

Een semantische configuratie heeft een naam en de volgende eigenschappen:

Eigenschappen Kenmerken
Het veld Titel Een korte tekenreeks, idealiter minder dan 25 woorden. Dit veld kan de titel zijn van een document, naam van een product of een unieke id. Als u geen geschikt veld hebt, laat u het veld leeg.
Inhoudsvelden Langere stukken tekst in natuurlijke taalvorm, afhankelijk van de maximale invoerlimieten voor tokens voor de machine learning-modellen. Veelvoorkomende voorbeelden zijn de hoofdtekst van een document, beschrijving van een product of andere vrije tekst.
Trefwoordvelden Een lijst met trefwoorden, zoals de tags in een document of een beschrijvende term, zoals de categorie van een item.

U kunt slechts één titelveld opgeven, maar u kunt zoveel inhouds- en trefwoordvelden hebben als u wilt. Voor inhouds- en trefwoordvelden kunt u de velden in volgorde van prioriteit weergeven, omdat velden met lagere prioriteit mogelijk worden afgekapt.

Voor alle semantische configuratie-eigenschappen moeten de velden die u toewijst het volgende zijn:

  • Toegeschreven als searchable en retrievable
  • Tekenreeksen van het type Edm.String, Collection(Edm.String)tekenreekssubvelden van Collection(Edm.ComplexType)
  1. Meld u aan bij Azure Portal en navigeer naar een zoekservice waarvoor semantische classificatie is ingeschakeld.

  2. Open vanuit Indexen in het linkernavigatiedeelvenster een index.

  3. Selecteer Semantische configuraties en selecteer vervolgens Semantische configuratie toevoegen.

    De pagina Nieuwe Semantische configuratie wordt geopend met opties voor het selecteren van een titelveld, inhoudsvelden en trefwoordvelden. Alleen doorzoekbare en ophaalbare tekenreeksvelden komen in aanmerking. Zorg ervoor dat u inhoudsvelden en trefwoordvelden in volgorde van prioriteit weer wilt geven.

    Screenshot that shows how to create a semantic configuration in the Azure portal.

    Selecteer OK om de wijzigingen op te slaan.

Migreren vanuit preview-versies

Als uw semantische classificatiecode preview-API's gebruikt, wordt in deze sectie uitgelegd hoe u migreert naar stabiele versies. U kunt de wijzigingslogboeken controleren op verificatie van algemene beschikbaarheid:

Gedragswijzigingen:

  • Vanaf 14 juli 2023 is semantische ranker taalneutraal. De resultaten kunnen opnieuw worden gerangschikt die bestaan uit meertalige inhoud, zonder vooroordelen voor een specifieke taal. In preview-versies zou semantische classificatie deprioritiseren van resultaten die verschillen van de taal die is opgegeven door de veldanalyse.

  • In 2021-04-30-Preview en alle latere versies, voor de REST API en alle SDK-pakketten die gericht zijn op dezelfde versie: semanticConfiguration (in een indexdefinitie) definieert welke zoekvelden worden gebruikt in semantische rangschikking. Voorheen werd in de REST API searchFields 2020-06-30-Preview (in een queryaanvraag) gebruikt voor veldspecificatie en prioriteitstelling. Deze benadering werkte alleen in 2020-06-30-Preview en is verouderd in alle andere versies.

Stap 1: QueryLanguage verwijderen

De semantische classificatie-engine is nu taalneutraal. Als queryLanguage deze is opgegeven in de querylogica, wordt deze niet meer gebruikt voor semantische classificatie, maar is deze nog steeds van toepassing op spellingcorrectie.

Houd queryLanguage bij als u spellingcontrole gebruikt en of de taalwaarde wordt ondersteund door de spellingfunctie. Spellingcontrole heeft beperkte beschikbaarheid in verschillende talen.

Verwijder anders queryLanguage.

Stap 2: Vervangen searchFields door semanticConfiguration

Als uw code de REST API-pakketten 2020-06-30-Preview of bèta-SDK-pakketten aanroept die gericht zijn searchFields op die REST API-versie, gebruikt u mogelijk in een queryaanvraag om semantische velden en prioriteiten op te geven. In de eerste bètaversies searchFields had u een dubbel doel, waarbij de eerste query werd beperkt tot de velden die worden vermeld in searchFieldsen ook veldprioriteit instellen als semantische rangschikking werd gebruikt. In latere versies searchFields behoudt u het oorspronkelijke doel, maar wordt niet meer gebruikt voor semantische rangschikking.

Houd searchFields queryaanvragen bij als u deze gebruikt om zoeken in volledige tekst te beperken tot de lijst met benoemde velden.

Voeg een semanticConfiguration toe aan een indexschema om veld prioritering op te geven, volgens de instructies in dit artikel.

Volgende stappen

Test uw semantische configuratie door een semantische query uit te voeren.