Úvod
Jazykové modely jsou stále oblíbenější, protože vytvářejí působivé koherentní odpovědi na otázky uživatele. Zvláště když uživatel komunikuje s jazykovým modelem prostřednictvím chatu, poskytuje intuitivní způsob, jak získat potřebné informace.
Jedním z nejčastějších výzev při implementaci jazykových modelů prostřednictvím chatu je tzv . uzemnění, které označuje, jestli je odpověď kořenem, připojena nebo ukotvena ve skutečnosti nebo konkrétním kontextu. Jinými slovy, uzemnění odkazuje na to, zda je odpověď jazykového modelu založená na faktických informacích.
Neuzemněné výzvy a odpovědi
Když použijete jazykový model k vygenerování odpovědi na výzvu, jediné informace, na kterých model musí odpověď založit, pochází z dat, na kterých byl natrénován – což je často jen velké množství nekontextového textu z internetu nebo z jiného zdroje.
Výsledkem bude pravděpodobně gramatická a logická odpověď na výzvu, ale protože není na základě relevantních faktických dat, je nekontextizovaná; a může být ve skutečnosti nepřesné a obsahovat "vynalezené" informace. Například otázka "Který produkt mám použít k použití pro X?" může obsahovat podrobnosti o fiktivním produktu.
Uzemněné výzvy a odpovědi
Naproti tomu zdroj dat můžete použít k uzemnění výzvy s určitým relevantním faktickým kontextem. Výzva se pak dá odeslat do jazykového modelu, včetně podkladových dat, a vygenerovat kontextovou, relevantní a přesnou odpověď.
Zdrojem dat může být libovolné úložiště relevantních dat. Můžete například použít data z databáze katalogu produktů k určení výzvy "Který produkt mám použít k provedení X?", aby odpověď obsahovala relevantní podrobnosti o produktech, které existují v katalogu.
V tomto modulu prozkoumáte, jak vytvořit vlastní chatovací aplikaci jazykového modelu, která je uzemněna, vytvořením zkopírovaného objektu s vlastními daty.