Shrnutí

2 min

V tomto modulu jste zjistili, jak optimalizovat výkon modelu AI generování pomocí doplňkových strategií v Microsoft Foundry.

Naučili jste se:

K optimalizaci výstupu modelu použijte techniky navrhování podnětů, včetně systémových zpráv, učení na několika ukázkách a parametrů modelu.
Pochopte, kdy a jak založit jazykový model pomocí RAG (Retrieval Augmented Generation).
Určete, kdy vyladění modelu zlepšuje konzistenci chování.
Porovnejte strategie optimalizace a určete, kdy je zkombinovat.

Klíčovým poznatkem je, že tvorba promptů, RAG a dolaďování nejsou konkurující si přístupy – jde o doplňkové strategie, které se zaměřují na různé dimenze výkonu modelu. Začněte s využitím techniky utváření promptů pro řízení chování modelu, přidejte RAG, pokud faktická přesnost vyžaduje data specifická pro doménu, a zvažte doladění, pokud potřebujete konzistentní styl a formát, které samotná technika utváření promptů nedokáže spolehlivě dosáhnout.

Pro scénář cestovní kanceláře může nejúčinnější řešení kombinovat všechny tři: jemně vyladěný model, který udržuje hlas značky, RAG, který zakládá odpovědi na skutečném hotelovém katalogu, a techniky navrhování promptů, které přidávají pokyny specifické pro konverzaci a bezpečnostní mantinely.

Více informací

Začínáme s přizpůsobením velkého jazykového modelu (LLM)
techniky projektování výzev
návrh zpráv systému
Generování s podporou vyhledávání v Microsoft Foundry
Přizpůsobit model s doladěním
Důležité informace o jemném ladění Microsoft Foundry
Augmentování velkých jazykových modelů pomocí RAG nebo jemného ladění

Váš názor

Byla tato stránka užitečná?