Szemantikai rangsoroló konfigurálása és feliratok visszaadása a keresési eredményekben
A szemantikai rangsor egy kezdeti eredményhalmazon keresztül iterál, és egy L2 rangsorolási módszertant alkalmaz, amely a legszembetűnőbb eredményeket segíti elő a verem tetejére. Szemantikai feliratokat is kaphat, kiemelve a legrelevánsabb kifejezéseket és kifejezéseket, valamint szemantikai válaszokat.
Ez a cikk bemutatja, hogyan konfigurálhat keresési indexet szemantikai újrarankáláshoz.
Előfeltételek
Keresési szolgáltatás alapszintű vagy magasabb szinten, a régió elérhetőségének függvényében.
A szemantikai rangsoroló engedélyezve van a keresési szolgáltatásban.
Meglévő keresési index rich text tartalommal. A szemantikai rangsorolás sztringek (nem adatmegjelenítő) mezőkre vonatkozik, és az információs vagy leíró tartalomon működik a legjobban.
Ügyfél kiválasztása
A szemantikai konfiguráció hozzáadásához az alábbi eszközök és SDK-k bármelyikét használhatja:
- Az Azure Portalon az indextervezővel adhat hozzá szemantikai konfigurációt.
- Visual Studio Code a REST-ügyféllel
- Azure SDK for .NET
- Pythonhoz készült Azure SDK
- Javához készült Azure SDK
- Azure SDK for JavaScript
Szemantikai konfiguráció hozzáadása
A szemantikai konfiguráció az index azon szakasza, amely mezőbemeneteket hoz létre a szemantikai rangsoroláshoz. Bármikor hozzáadhat vagy frissíthet szemantikai konfigurációt, nincs szükség újraépítésre. Ha több konfigurációt hoz létre, megadhat egy alapértelmezett beállítást. Lekérdezéskor adjon meg egy szemantikai konfigurációt egy lekérdezési kérelemben, vagy hagyja üresen az alapértelmezett beállítás használatához.
A szemantikai konfiguráció neve és a következő tulajdonságok:
Tulajdonság | Jellemzők |
---|---|
A Cím mező | Egy rövid sztring, ideális esetben 25 szó alatt. Ez a mező lehet egy dokumentum címe, egy termék neve vagy egy egyedi azonosító. Ha nem rendelkezik megfelelő mezővel, hagyja üresen. |
Tartalommezők | Hosszabb szöveges adattömbök természetes nyelvi formában, a gépi tanulási modellek maximális tokenbeviteli korlátainak függvényében. Gyakori példák például a dokumentum törzse, egy termék leírása vagy más szabad formátumú szöveg. |
Kulcsszómezők | Kulcsszavak listája, például egy dokumentum címkéi vagy egy leíró kifejezés, például egy elem kategóriája. |
Csak egy címmezőt adhat meg, de tetszőleges számú tartalom- és kulcsszómezővel rendelkezhet. Tartalom- és kulcsszómezők esetén a mezők prioritási sorrendben jelennek meg, mert az alacsonyabb prioritású mezők csonkoltak lehetnek.
Az összes szemantikai konfigurációs tulajdonságban a hozzárendelt mezőknek a következőknek kell lenniük:
- Attribútumként
searchable
ésretrievable
- Típussztringek
Edm.String
,Collection(Edm.String)
sztring almezőkEdm.ComplexType
Jelentkezzen be az Azure Portalra, és keresse meg a szemantikai rangsorolást engedélyező keresési szolgáltatást.
A bal oldali navigációs panel indexei között nyisson meg egy indexet.
Válassza a Szemantikai konfigurációk lehetőséget, majd válassza a Szemantikai konfiguráció hozzáadása lehetőséget.
Megnyílik az Új szemantikai konfiguráció lap, amelyen a címmezők, a tartalommezők és a kulcsszómezők választhatók. Csak kereshető és lekérhető sztringmezők jogosultak. Ügyeljen arra, hogy a tartalommezők és a kulcsszómezők prioritási sorrendben legyenek felsorolva.
A módosítások mentéséhez kattintson az OK gombra .
Migrálás előzetes verzióról
Ha a szemantikai rangsorolási kód előzetes verziójú API-kat használ, ez a szakasz bemutatja, hogyan migrálhat stabil verziókra. A változásnaplókban ellenőrizheti az általános rendelkezésre állást:
- 2024-07-01 (REST)
- Az Azure SDK for .NET (11.5) változásnaplója
- Azure SDK for Python (11.4) változásnaplója
- Azure SDK for Java (11.6) változásnapló
- Azure SDK for JavaScript (12.0) változásnapló
Viselkedésváltozások:
2023. július 14-től a szemantikai rangsoroló nyelvfüggetlen. Többnyelvű tartalomból álló eredményeket képes rerankálni, és nincs elfogultság egy adott nyelv felé. Az előzetes verziókban a szemantikai rangsorolás a mezőelemző által megadott nyelvtől eltérő eredményeket deprioritizálna.
A 2021-04-30-Preview és az összes későbbi verzió esetében a REST API és az összes SDK-csomag ugyanazt a verziót célozza:
semanticConfiguration
(indexdefinícióban) meghatározza, hogy mely keresési mezőket használják a szemantikai rangsorolásban. Korábban a 2020-06-30-preview REST API-bansearchFields
(lekérdezési kérelemben) használták a mező specifikációját és rangsorolását. Ez a megközelítés csak 2020-06-30-Preview verzióban működött, és minden más verzióban elavult.
1. lépés: A queryLanguage eltávolítása
A szemantikai rangsoroló motor most már nyelvi agnosztikus. Ha queryLanguage
a lekérdezési logikában meg van adva, az már nem használatos szemantikai rangsoroláshoz, de továbbra is a helyesírás-javításra vonatkozik.
Tartsa meg queryLanguage
, ha helyesírás-ellenőrzőt használ, és ha a nyelvi értéket támogatja a helyesírás-ellenőrző. A helyesírás-ellenőrzés nyelvnként korlátozottan érhető el.
Ellenkező esetben törölje a elemet queryLanguage
.
2. lépés: Csere a következőre searchFields
: semanticConfiguration
Ha a kód meghívja a 2020-06-30-preview REST API-t vagy a REST API-verziót célzó béta SDK-csomagokat, előfordulhat searchFields
, hogy egy lekérdezési kérelemben szemantikai mezőket és prioritásokat határoz meg. A kezdeti bétaverziókban searchFields
kettős célt szolgáltak, a kezdeti lekérdezést a felsorolt searchFields
mezőkre korlátozták, és a szemantikai rangsorolás használata esetén a mező prioritását is meghatározták. A későbbi verziókban searchFields
megtartja eredeti célját, de már nem használják szemantikai rangsorolásra.
Ha a teljes szöveges keresést az elnevezett mezők listájára szeretné korlátozni, tartsa meg searchFields
a lekérdezési kérelmeket.
Adjon hozzá egy semanticConfiguration
indexsémát a mezők rangsorolásának megadásához a jelen cikkben ismertetett utasításokat követve.
Következő lépések
Szemantikai lekérdezés futtatásával tesztelje a szemantikai konfigurációt.