Shrnutí
V tomto modulu jste zjistili, jak optimalizovat výkon modelu AI generování pomocí doplňkových strategií v Microsoft Foundry.
Naučili jste se:
- K optimalizaci výstupu modelu použijte techniky navrhování podnětů, včetně systémových zpráv, učení na několika ukázkách a parametrů modelu.
- Pochopte, kdy a jak založit jazykový model pomocí RAG (Retrieval Augmented Generation).
- Určete, kdy vyladění modelu zlepšuje konzistenci chování.
- Porovnejte strategie optimalizace a určete, kdy je zkombinovat.
Klíčovým poznatkem je, že tvorba promptů, RAG a dolaďování nejsou konkurující si přístupy – jde o doplňkové strategie, které se zaměřují na různé dimenze výkonu modelu. Začněte s využitím techniky utváření promptů pro řízení chování modelu, přidejte RAG, pokud faktická přesnost vyžaduje data specifická pro doménu, a zvažte doladění, pokud potřebujete konzistentní styl a formát, které samotná technika utváření promptů nedokáže spolehlivě dosáhnout.
Pro scénář cestovní kanceláře může nejúčinnější řešení kombinovat všechny tři: jemně vyladěný model, který udržuje hlas značky, RAG, který zakládá odpovědi na skutečném hotelovém katalogu, a techniky navrhování promptů, které přidávají pokyny specifické pro konverzaci a bezpečnostní mantinely.
Více informací
- Začínáme s přizpůsobením velkého jazykového modelu (LLM)
- techniky projektování výzev
- návrh zpráv systému
- Generování s podporou vyhledávání v Microsoft Foundry
- Přizpůsobit model s doladěním
- Důležité informace o jemném ladění Microsoft Foundry
- Augmentování velkých jazykových modelů pomocí RAG nebo jemného ladění