A keresési összetevők ismertetése

Befejeződött

Az AI Search-megoldások több összetevőből állnak, és mindegyik fontos szerepet játszik az adatok kinyerésének, bővítésének, indexelésének és keresésének folyamatában.

Adatforrás

A diagram showing a conceptual illustration of a data source.

A legtöbb keresési megoldás a keresendő adatokat tartalmazó adatforrással kezdődik. Az Azure AI Search többféle adatforrástípust támogat, többek között a következőket:

  • Strukturálatlan fájlok az Azure Blob Storage-tárolókban.
  • Táblák az Azure SQL Database-ben.
  • Dokumentumok a Cosmos DB-ben.

Az Azure AI Search képes adatokat lekérni ezekből az adatforrásokból indexelés céljából.

Azt is megteheti, hogy az alkalmazások közvetlenül egy indexbe küldik a JSON-adatokat anélkül, hogy lekérik őket egy meglévő adattárból.

Skillset

A diagram a conceptual illustration of a skillset.

Egy alapszintű keresési megoldásban indexelheti az adatforrásból kinyert adatokat. A kinyerhető információk az adatforrástól függenek. Ha például egy adatbázisban indexeli az adatokat, az adatbázistáblák mezői kinyerhetők; vagy egy dokumentumcsoport indexelésekor a dokumentum szöveges tartalmával együtt kinyerhetők a fájl metaadatai, például a fájlnév, a módosított dátum, a méret és a szerző.

Bár hasznos lehet egy olyan alapszintű keresési megoldás, amely közvetlenül az adatforrásból kinyert adatértékeket indexel, a modern alkalmazásfelhasználók elvárásai miatt az adatok részletesebb elemzésére van szükség. Az Azure AI Searchben az indexelési folyamat részeként mesterségesintelligencia- (AI-) készségeket alkalmazhat a forrásadatok új információkkal való gazdagításához, amelyek indexmezőkre képezhetők le. Az indexelők által használt készségek egy olyan képességkészletbe vannak beágyazva, amely egy bővítési folyamatot határoz meg, amelyben minden lépés egy adott AI-képesség által szerzett megállapításokkal javítja a forrásadatokat. Példák az AI-képességekkel kinyerhető információk típusára:

  • A dokumentum írásának nyelve.
  • Olyan kulcskifejezések, amelyek segíthetnek meghatározni a dokumentumban tárgyalt fő témákat vagy témaköröket.
  • Hangulatpont, amely számszerűsíti, hogy mennyire pozitív vagy negatív egy dokumentum.
  • A tartalomban említett konkrét helyek, személyek, szervezetek vagy nevezetességek.
  • Képek AI által létrehozott leírásai vagy optikai karakterfelismeréssel kinyert képszövegek.
  • Egyéni készségek, amelyeket meghatározott követelményeknek megfelelően fejleszt.

Indexelő

A diagram showing a conceputal illustration of an indexer.

Az indexelő az a motor, amely az általános indexelési folyamatot vezérli. Az eredeti adatforrásból kinyert adatokkal és metaadatértékekkel együtt a képességkészlet képességeivel kinyert kimeneteket az index mezőihez rendeli.

Az indexelők létrehozásakor automatikusan futnak, és ütemezhetők rendszeres időközönként, vagy igény szerint futtathatók, hogy további dokumentumokat adjanak hozzá az indexhez. Bizonyos esetekben, például amikor új mezőket ad hozzá egy indexhez, vagy új készségeket ad hozzá egy képességkészlethez, előfordulhat, hogy az indexelő újbóli futtatása előtt alaphelyzetbe kell állítania az indexet.

Index

A diagram showing a conceputal illustration of an index.

Az index az indexelési folyamat kereshető eredménye. JSON-dokumentumok gyűjteményéből áll, az indexelés során kinyert értékeket tartalmazó mezőkkel. Az ügyfélalkalmazások lekérdezhetik az indexet az információk lekéréséhez, szűréséhez és rendezéséhez.

Minden indexmező a következő attribútumokkal konfigurálható:

  • kulcs: Az indexrekordok egyedi kulcsát meghatározó mezők.
  • kereshető: A teljes szöveges kereséssel lekérdezhető mezők.
  • szűrhető: Olyan mezők, amelyek a szűrőkifejezésekbe belefoglalhatók, hogy csak a megadott korlátozásoknak megfelelő dokumentumokat adjanak vissza.
  • rendezhető: Az eredmények rendezésére használható mezők.
  • facetable: A aspektusok értékeinek meghatározására használható mezők (az ismert mezőértékek listája alapján az eredmények szűréséhez használt felhasználói felületi elemek).
  • beolvasható: A keresési eredményekben szerepelhető mezők (alapértelmezés szerint az összes mező lekérthető, kivéve, ha az attribútum explicit módon el lett távolítva).