Semantische rangschikking configureren en bijschriften retourneren in zoekresultaten
Semantische classificatie itereert over een initiële resultatenset, waarbij een L2-classificatiemethode wordt toegepast die de meest semantisch relevante resultaten aan de bovenkant van de stack bevordert. U kunt ook semantische bijschriften krijgen, met markeringen over de meest relevante termen en woordgroepen en semantische antwoorden.
In dit artikel wordt uitgelegd hoe u een zoekindex configureert voor semantische herrankering.
Vereisten
Een zoekservice op een Basic-laag of hoger, afhankelijk van beschikbaarheid van regio's.
Semantische rangschikking ingeschakeld voor uw zoekservice.
Een bestaande zoekindex met inhoud met tekst met opmaak. Semantische classificatie is van toepassing op tekenreeksvelden (nonvectorvelden) en werkt het beste voor inhoud die informatief of beschrijvend is.
Een client kiezen
U kunt een van de volgende hulpprogramma's en SDK's (Software Development Kits) gebruiken om een semantische configuratie toe te voegen:
- Azure Portal met behulp van de indexontwerper om een semantische configuratie toe te voegen.
- Visual Studio Code met de REST-client
- Azure-SDK voor .NET
- Azure-SDK voor Python
- Azure SDK voor Java
- Azure SDK voor JavaScript
Een semantische configuratie toevoegen
Een semantische configuratie is een sectie in uw index waarmee veldinvoer voor semantische classificatie wordt vastgesteld. U kunt op elk gewenst moment een semantische configuratie toevoegen of bijwerken, zonder dat u deze opnieuw hoeft te bouwen. Als u meerdere configuraties maakt, kunt u een standaard opgeven. Geef tijdens query's een semantische configuratie op voor een queryaanvraag of laat deze leeg om de standaardinstelling te gebruiken.
Een semantische configuratie heeft een naam en de volgende eigenschappen:
Eigenschappen | Kenmerken |
---|---|
Het veld Titel | Een korte tekenreeks, idealiter minder dan 25 woorden. Dit veld kan de titel zijn van een document, naam van een product of een unieke id. Als u geen geschikt veld hebt, laat u het veld leeg. |
Inhoudsvelden | Langere stukken tekst in natuurlijke taalvorm, afhankelijk van de maximale invoerlimieten voor tokens voor de machine learning-modellen. Veelvoorkomende voorbeelden zijn de hoofdtekst van een document, beschrijving van een product of andere vrije tekst. |
Trefwoordvelden | Een lijst met trefwoorden, zoals de tags in een document of een beschrijvende term, zoals de categorie van een item. |
U kunt slechts één titelveld opgeven, maar u kunt zoveel inhouds- en trefwoordvelden hebben als u wilt. Voor inhouds- en trefwoordvelden kunt u de velden in volgorde van prioriteit weergeven, omdat velden met lagere prioriteit mogelijk worden afgekapt.
Voor alle semantische configuratie-eigenschappen moeten de velden die u toewijst het volgende zijn:
- Toegeschreven als
searchable
enretrievable
- Tekenreeksen van het type
Edm.String
,Collection(Edm.String)
tekenreekssubvelden vanEdm.ComplexType
Meld u aan bij Azure Portal en navigeer naar een zoekservice waarvoor semantische classificatie is ingeschakeld.
Selecteer een index in indexen in het linkernavigatiedeelvenster.
Selecteer Semantische configuraties en selecteer vervolgens Semantische configuratie toevoegen.
Voer op de pagina Nieuwe semantische configuratie een semantische configuratienaam in en selecteer de velden die u wilt gebruiken in de semantische configuratie. Alleen doorzoekbare en ophaalbare tekenreeksvelden komen in aanmerking. Zorg ervoor dat u inhoudsvelden en trefwoordvelden in volgorde van prioriteit weer wilt geven.
Selecteer Opslaan om de configuratie-instellingen op te slaan.
Selecteer Opnieuw opslaan op de indexpagina om de semantische configuratie in de index op te slaan.
Migreren vanuit preview-versies
Als uw semantische classificatiecode preview-API's gebruikt, wordt in deze sectie uitgelegd hoe u migreert naar stabiele versies. U kunt de wijzigingslogboeken controleren op verificatie van algemene beschikbaarheid:
- 2024-07-01 (REST)
- Azure SDK voor .NET (11.5) wijzigingslogboek
- Azure SDK voor Python (11.4) wijzigingslogboek
- Wijzigingslogboek voor Azure SDK voor Java (11.6)
- Wijzigingslogboek voor Azure SDK voor JavaScript (12.0)
queryLanguage voor semantische rangschikking
Vanaf 14 juli 2023 is semantische ranker taalneutraal. De resultaten kunnen opnieuw worden gerangschikt die bestaan uit meertalige inhoud, zonder vooroordelen voor een specifieke taal. In preview-versies zou semantische classificatie deprioritiseren van resultaten die verschillen van de taal die is opgegeven door de veldanalyse.
Stop met het gebruik van queryLanguage
uw code als u deze gebruikte voor semantische classificatie. De queryLanguage
eigenschap is nog steeds van toepassing op functies zoals spellingcorrectie, maar niet op semantische classificatie.
searchFields voor semantische ranker
Voor de REST API en alle SDK-pakketten die gericht zijn op versie 2021-04-30-Preview
en hoger, wordt de searchFields
eigenschap niet meer gebruikt voor semantische rangschikking.
Gebruik in plaats daarvan de semanticConfiguration
eigenschap (in een zoekindex) om te bepalen welke zoekvelden worden gebruikt in semantische rangschikking. Als u de prioriteit van velden wilt opgeven, voegt u een semanticConfiguration
item toe aan een indexschema volgens de instructies in dit artikel.
U kunt queryaanvragen bijhouden searchFields
als u deze gebruikt om zoeken in volledige tekst te beperken tot de lijst met benoemde velden.
Volgende stappen
Test uw semantische configuratie door een semantische query uit te voeren.