Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A lekéréses kiegészítésű generáció (RAG) egy hatékony technika, amely a nagy nyelvi modelleket (LLM-eket) valós idejű adatlekéréssel kombinálva pontosabb, up-todátum- és környezetfüggő válaszokat hoz létre.
Ez a megközelítés különösen hasznos a védett, gyakran változó vagy tartományspecifikus információkkal kapcsolatos kérdések megválaszolásához.
Mi az a lekérdezéssel kibővített generáció?
A legegyszerűbb formában a RAG-ügynök a következőket teszi:
- Lekérés: A felhasználó kérése egy külső tudásbázis lekérdezésére szolgál, például vektortárra, kulcsszókeresésre vagy SQL-adatbázisra. A cél az LLM válaszához kapcsolódó támogató adatok lekérése.
- Bővítés: A támogató adatok a felhasználó kérésével kombinálva gyakran egy sablont használnak, amely további formázást és utasításokat tartalmaz az LLM-hez, hogy létrehozhasson egy kérést.
- Generáció: A rendszer az LLM-nek küldi el a kérést, amely választ ad a felhasználó kérésére.
RAG-előnyök
A RAG a következő módokon javítja az LLM-eket:
- Tulajdonosi ismeretek: A RAG tartalmazhat olyan védett információkat, amelyek eredetileg nem használhatók az LLM betanítása érdekében, például emlékeztetőket, e-maileket és dokumentumokat a tartományspecifikus kérdések megválaszolásához.
- Naprakész információk: A RAG-alkalmazások információt szolgáltathatnak az LLM-nek egy frissített tudásbázisból.
- Források idézése: A RAG lehetővé teszi az LLM-eknek, hogy konkrét forrásokra hivatkozhassanak, így a felhasználók ellenőrizhetik a válaszok tényleges pontosságát.
- Adatbiztonsági és hozzáférés-vezérlési listák (ACL): A lekérési lépés úgy is kialakítható, hogy a felhasználói hitelesítő adatok alapján szelektíven kérje le a személyes vagy védett adatokat.
RAG-összetevők
Egy tipikus RAG-alkalmazás több fázisból áll:
Adatfolyam: Dokumentumok, táblák vagy egyéb adatok előzetes feldolgozása és indexelése a gyors és pontos lekérés érdekében.
RAG-lánc (lekérés, bővítés, létrehozás): Hívjon meg egy lépéssorozatot (vagy lépésláncot) a következő célra:
- A felhasználó kérdésének megismerése.
- Támogató adatok lekérése.
- Bővítse a kérést támogató adatokkal.
- Válasz létrehozása egy LLM-ből a bővített parancssor használatával.
Értékelés és monitorozás: Értékelje a RAG-alkalmazást annak minőségének, költségének és késésének meghatározásához, hogy megfeleljen az üzleti követelményeknek.
Irányítás és LLMOps: Az egyes összetevők életciklusának nyomon követése és kezelése, beleértve az adatkisorolást és a hozzáférés-vezérlést.
A RAG-adatok típusai: strukturált és strukturálatlan
A RAG-architektúra strukturálatlan vagy strukturált támogató adatokkal is használható. A RAG használatával használt adatok a használati esettől függenek.
Strukturálatlan adatok: Adott struktúra vagy szervezet nélküli adatok.
- PDF-fájlok
- Google-/Office-dokumentumok
- Wikioldalak
- Képek
- Videók
Strukturált adatok: táblázatos adatokat egy adott sémával rendelkező sorokba és oszlopokba, például egy adatbázis tábláiba rendezve.
- Ügyfélrekordok bi- vagy adattárházrendszerben
- Tranzakciós adatok SQL-adatbázisból
- Alkalmazás API-kból származó adatok (pl. SAP, Salesforce stb.)
Értékelés és monitorozás
A kiértékelés és a monitorozás segít megállapítani, hogy a RAG-alkalmazás megfelel-e a minőségi, költség- és késési követelményeknek. A kiértékelés a fejlesztés során történik, míg a monitorozás az alkalmazás éles környezetben való üzembe helyezése után történik.
A strukturálatlan adatokra vonatkozó RAG számos olyan összetevőt tartalmaz, amelyek hatással vannak a minőségre. Az adatformázás megváltozása például befolyásolhatja a visszakeresett adattömböket, és befolyásolhatja az LLM releváns válaszok generálására való képességét. Ezért fontos az egyes összetevők kiértékelése az általános alkalmazás mellett.
További információ: Mozaik AI-ügynök értékelése (MLflow 2).
RAG a(z) Databricksen
A Databricks egy végpontok közötti platformot kínál a RAG-fejlesztéshez, beleértve a következőket:
- Integrált adatfolyamok a Delta Lake és a Lakeflow deklaratív folyamataival
- Méretezhető vektorkeresés a Databricks Vector Search használatával
- Modell-kiszolgáló és vezénylő eszközök
- Gen AI-értékelés a teljesítmény és a minőség javítása érdekében
- Gen AI-monitorozás üzembe helyezett RAG-alkalmazásokhoz
- Beépített irányítás és biztonság, lásd: Security and Trust Center és AI Gateway.
Következő lépések
Ismerje meg az adatfolyamokat, amelyek a RAG-alkalmazások kulcsfontosságú összetevői. Lásd: Strukturálatlan adatfolyam létrehozása RAG-hoz
Használja az AI Játékteret saját RAG-ügynöke prototípusának elkészítéséhez. Tekintse meg a prototípus eszközöket meghívó ügynököket az AI játszótéren.
- Az Ügynöktéglák használata: A Tudássegéd csevegőrobotként hoz létre RAG-ügynököt a dokumentumokon, és végpontként, amelyet az alsóbb rétegbeli alkalmazásokban is használhat. Lásd: Agent Bricks - Tudásasszisztens segítségével hozhat létre kiváló minőségű chatbotot a dokumentumai alapján.