Keresés az indexekben

Befejeződött

Miután létrehozott és feltöltött egy indexet, lekérdezheti az indexelt dokumentum tartalmában lévő információk kereséséhez. Bár az indexbejegyzéseket egyszerű mezőérték-egyeztetés alapján is lekérheti, a legtöbb keresési megoldás teljes szöveges keresési szemantikával kérdez le egy indexet.

A teljes szöveges keresés olyan keresési megoldásokat ír le, amelyek szövegalapú dokumentumtartalmakat elemeznek a lekérdezési kifejezések kereséséhez. Az Azure AI Search teljes szöveges keresési lekérdezései a Lucene lekérdezési szintaxison alapulnak, amely számos lekérdezési műveletet biztosít az indexekben lévő adatok kereséséhez, szűréséhez és rendezéséhez. Az Azure AI Search a Lucene szintaxis két változatát támogatja:

  • Egyszerű – Intuitív szintaxis, amely megkönnyíti a felhasználó által küldött szó szerinti lekérdezési kifejezéseknek megfelelő alapszintű kereséseket.
  • Teljes – Bővített szintaxis, amely támogatja az összetett szűrést, a reguláris kifejezéseket és más kifinomultabb lekérdezéseket.

Az ügyfélalkalmazások lekérdezéseket küldenek az Azure AI Search szolgáltatásba egy keresési kifejezés és más paraméterek megadásával, amelyek meghatározzák a kifejezés kiértékelésének és a visszaadott eredményeknek a módját. A lekérdezéssel elküldött gyakori paraméterek közé tartoznak a következők:

  • keresés – A keresendő kifejezéseket tartalmazó keresőkifejezés.
  • queryType – A kiértékelendő Lucene szintaxis (egyszerű vagy teljes).
  • searchFields – A keresendő indexmezők.
  • select – Az eredményekben szerepeltetni kívánt mezők.
  • searchMode – A találatok több keresési kifejezésen alapuló belefogalmazása. Tegyük fel például, hogy kényelmes szállodát keres. Az Any keresésiMode értéke olyan dokumentumokat ad vissza, amelyek "kényelmes", "hotel" vagy mindkettőt tartalmaznak; míg az Összes keresőszó értéke a "kényelmes" és a "hotel" dokumentumokat tartalmazó dokumentumokra korlátozza a találatokat.

A lekérdezésfeldolgozás négy szakaszból áll:

  1. Lekérdezés elemzése. A keresési kifejezés kiértékelése és rekonstruálása a megfelelő al lekérdezések fájaként történik. Az allekérdezések közé tartozhatnak a kifejezéslekérdezések (adott szavak keresése a keresési kifejezésben – például szálloda), kifejezéslekérdezések (a keresőkifejezésben idézőjelekben megadott többkifejezéses kifejezések keresése – például "ingyenes parkolás"), valamint előtaglekérdezések (adott előtaggal rendelkező kifejezések keresése – például levegő*, amely megfelelne a légutaknak, a légkondicionálónak és a repülőtérnek).
  2. Lexikális elemzés – A lekérdezési kifejezések nyelvi szabályok alapján vannak elemezve és pontosítva. A szöveg például kisbetűssé alakul, és a rendszer eltávolítja a nem fontos stopwords parancsokat (például "a", "a", "is" stb.). Ezután a szavak gyökéralakjukká alakulnak (például a "kényelmes" egyszerűsödhet a "kényelem" kifejezésre), és az összetett szavakat a rendszer az alkotó kifejezésekre osztja.
  3. Dokumentumlekérés – A lekérdezési kifejezések megegyeznek az indexelt feltételekkel, és a rendszer azonosítja az egyező dokumentumok készletét.
  4. Pontozás – Minden eredményhez relevanciapont van hozzárendelve a kifejezés gyakorisága/inverz dokumentum gyakorisága (TF/IDF) számítása alapján.

Megjegyzés:

Az index lekérdezésével és az egyszerű és teljes szintaxissal kapcsolatos további információkért tekintse meg az Azure AI Search lekérdezési típusait és összetételét az Azure AI Search dokumentációjában.