Keresés az indexekben
Miután létrehozott és feltöltött egy indexet, lekérdezheti az indexelt dokumentum tartalmában lévő információk kereséséhez. Bár az indexbejegyzéseket egyszerű mezőérték-egyeztetés alapján is lekérheti, a legtöbb keresési megoldás teljes szöveges keresési szemantikával kérdez le egy indexet.
Teljes szöveges keresés
A teljes szöveges keresés olyan keresési megoldásokat ír le, amelyek szövegalapú dokumentumtartalmakat elemeznek a lekérdezési kifejezések kereséséhez. Az Azure AI Search teljes szöveges keresési lekérdezései a Lucene lekérdezési szintaxison alapulnak, amely számos lekérdezési műveletet biztosít az indexekben lévő adatok kereséséhez, szűréséhez és rendezéséhez. Az Azure AI Search a Lucene szintaxis két változatát támogatja:
- Egyszerű – Intuitív szintaxis, amely megkönnyíti a felhasználó által küldött szó szerinti lekérdezési kifejezéseknek megfelelő alapszintű kereséseket.
- Teljes – Bővített szintaxis, amely támogatja az összetett szűrést, a reguláris kifejezéseket és más kifinomultabb lekérdezéseket.
Az ügyfélalkalmazások lekérdezéseket küldenek az Azure AI Search szolgáltatásba egy keresési kifejezés és más paraméterek megadásával, amelyek meghatározzák a kifejezés kiértékelésének és a visszaadott eredményeknek a módját. A lekérdezéssel elküldött gyakori paraméterek közé tartoznak a következők:
- keresés – A keresendő kifejezéseket tartalmazó keresőkifejezés.
- queryType – A kiértékelendő Lucene szintaxis (egyszerű vagy teljes).
- searchFields – A keresendő indexmezők.
- select – Az eredményekben szerepeltetni kívánt mezők.
- searchMode – A találatok több keresési kifejezésen alapuló belefogalmazása. Tegyük fel például, hogy kényelmes szállodát keres. Az Any keresésiMode értéke olyan dokumentumokat ad vissza, amelyek "kényelmes", "hotel" vagy mindkettőt tartalmaznak; míg az Összes keresőszó értéke a "kényelmes" és a "hotel" dokumentumokat tartalmazó dokumentumokra korlátozza a találatokat.
A lekérdezésfeldolgozás négy szakaszból áll:
- Lekérdezés elemzése. A keresési kifejezés kiértékelése és rekonstruálása a megfelelő al lekérdezések fájaként történik. Az allekérdezések közé tartozhatnak a kifejezéslekérdezések (adott szavak keresése a keresési kifejezésben – például szálloda), kifejezéslekérdezések (a keresőkifejezésben idézőjelekben megadott többkifejezéses kifejezések keresése – például "ingyenes parkolás"), valamint előtaglekérdezések (adott előtaggal rendelkező kifejezések keresése – például levegő*, amely megfelelne a légutaknak, a légkondicionálónak és a repülőtérnek).
- Lexikális elemzés – A lekérdezési kifejezések nyelvi szabályok alapján vannak elemezve és pontosítva. A szöveg például kisbetűssé alakul, és a rendszer eltávolítja a nem fontos stopwords parancsokat (például "a", "a", "is" stb.). Ezután a szavak gyökéralakjukká alakulnak (például a "kényelmes" egyszerűsödhet a "kényelem" kifejezésre), és az összetett szavakat a rendszer az alkotó kifejezésekre osztja.
- Dokumentumlekérés – A lekérdezési kifejezések megegyeznek az indexelt feltételekkel, és a rendszer azonosítja az egyező dokumentumok készletét.
- Pontozás – Minden eredményhez relevanciapont van hozzárendelve a kifejezés gyakorisága/inverz dokumentum gyakorisága (TF/IDF) számítása alapján.
Megjegyzés:
Az index lekérdezésével és az egyszerű és teljes szintaxissal kapcsolatos további információkért tekintse meg az Azure AI Search lekérdezési típusait és összetételét az Azure AI Search dokumentációjában.