Principy načítání rozšířené generace (RAG) se službou Azure OpenAI

3 min

RAG s Azure OpenAI umožňuje vývojářům používat podporované modely chatu AI, které můžou odkazovat na konkrétní zdroje informací k základu odpovědi. Přidání těchto informací umožňuje modelu odkazovat jak na konkrétní data, tak na předem natrénované znalosti, aby poskytoval efektivnější odpovědi.

Azure OpenAI umožňuje RAG připojením předem natrénovaných modelů k vašim vlastním zdrojům dat. Azure OpenAI ve vašich datech využívá možnost vyhledávání azure AI Search k přidání příslušných bloků dat do výzvy. Jakmile jsou vaše data v indexu AI Search, Azure OpenAI na vašich datech prochází následujícími kroky:

Přijmout výzvu uživatele.
Určete relevantní obsah a záměr výzvy.
Dotazujte se na index vyhledávání s daným obsahem a záměrem.
Vložte blok výsledků hledání do výzvy Azure OpenAI spolu se systémovou zprávou a výzvou uživatele.
Odeslání celé výzvy do Azure OpenAI
Vrátí odpověď a odkaz na data (pokud existuje) uživateli.

Azure OpenAI ve vašich datech ve výchozím nastavení podporuje, ale nevyžaduje, model, který bude reagovat jenom pomocí vašich dat. Toto nastavení může být při připojování dat nevybrané, což může vést k tomu, že model zvolí použití předem natrénovaných znalostí pro vaše data.

Jemné ladění vs. RAG

Vyladění je technika, která se používá k vytvoření vlastního modelu trénováním existujícího základního modelu, jako gpt-35-turbo je datová sada dalších trénovacích dat. Vyladění může vést k vyšším požadavkům na kvalitu než samotné zpracování výzvy, přizpůsobit model u příkladů větších, než se vejde do výzvy, a umožnit uživateli poskytnout méně příkladů, aby získal stejnou vysoce kvalitní odpověď. Proces jemného ladění je ale nákladný i časově náročný a měl by se použít pouze pro případy použití, kde je to nezbytné.

RAG s Azure OpenAI na vašich datech stále používá bezstavové rozhraní API pro připojení k modelu, které eliminuje požadavek na trénování vlastního modelu s vašimi daty a zjednodušuje interakci s modelem AI. Služba AI Search nejprve najde užitečné informace pro odpověď na výzvu, přidá ji do výzvy jako podkladová data a Azure OpenAI vytvoří odpověď na základě této informace.

Principy načítání rozšířené generace (RAG) se službou Azure OpenAI

Jemné ladění vs. RAG

Váš názor