Učení s nulovým snímkem a několika snímky

Článek
05/20/2024

Tento článek vysvětluje učení s nulovým snímkem a učení s několika snímky pro přípravu výzev v .NET, včetně jejich primárních případů použití.

Výkon modelu GPT přináší výhody z rychlého inženýrství, praxe poskytování pokynů a příkladů modelu za účelem upřesnění jeho výstupu. Učení s nulovým snímkem a učení s několika snímky jsou techniky, které můžete použít při poskytování příkladů.

Při učení s nulovým snímkem zahrnete výzvy, ale ne doslovné dokončování. Můžete zahrnout dokončování, která se skládají jenom z upozornění. Učení s nulovým snímkem spoléhá zcela na stávající znalosti modelu k vygenerování odpovědí, což snižuje počet vytvořených tokenů a může vám pomoct řídit náklady. Učení s nulovým snímkem se ale nepřidá do znalostí modelu.

Tady je příklad výzvy s nulovým snímkem, který modelu říká, aby vyhodnotil vstup uživatele, aby určil, který ze čtyř možných záměrů vstup představuje, a pak před odpověď zadejte "Intent: ".

prompt = $"""
Instructions: What is the intent of this request?
If you don't know the intent, don't guess; instead respond with "Unknown".
Choices: SendEmail, SendMessage, CompleteTask, CreateDocument, Unknown.
User Input: {request}
Intent: 
""";

S několika snímky učení zahrnete výzvy spárované s doslovnými dokončováními. Ve srovnání s učením s nulovým snímkem to znamená, že učení s několika snímky vytváří více tokenů a způsobí, že model aktualizuje své znalosti, což může způsobit, že učení s několika snímky je náročnější na prostředky. Z stejných důvodů ale málo snímků učení také pomáhá modelu vytvářet relevantnější odpovědi.

prompt = $"""
Instructions: What is the intent of this request?
If you don't know the intent, don't guess; instead respond with "Unknown".
Choices: SendEmail, SendMessage, CompleteTask, CreateDocument, Unknown.

User Input: Can you send a very quick approval to the marketing team?
Intent: SendMessage

User Input: Can you send the full update to the marketing team?
Intent: SendEmail

User Input: {request}
Intent:
""";

Případy použití učení s nulovým snímkem

Učení s nulovým snímkem je postup předávání výzev, které nejsou spárované s doslovnými dokončováními, i když je lze spárovat s upozorněním. Pro učení s nulovým snímkem existují dva hlavní případy použití:

Práce s jemně vyladěnými llmy – vzhledem k tomu, že se spoléhá na stávající znalosti modelu, učení s nulovým snímkem není tak náročné na prostředky jako učení s několika snímky a funguje dobře s LLM, které už byly vyladěné na datových sadách instrukcí. Možná budete moct spoléhat výhradně na učení s nulovým snímkem a udržet náklady relativně nízké.
Vytvoření standardních hodnot výkonu – učení s nulovým snímkem vám může pomoct simulovat, jak by vaše aplikace fungovala pro skutečné uživatele. Díky tomu můžete vyhodnotit různé aspekty aktuálního výkonu modelu, jako je přesnost nebo přesnost. V tomto případě obvykle použijete učení s nulovým snímkem k vytvoření standardních hodnot výkonu a pak experimentujete s několika snímky učení, abyste zlepšili výkon.

Případy použití učení s několika snímky

Učení s několika snímky je postup předávání výzev spárovaných s doslovnými dokončováními (několik snímků výzev) a ukázat model, jak reagovat. Na rozdíl od učení s nulovým snímkem může učení s několika snímky přidávat do znalostí modelu. Můžete dokonce použít vlastní datové sady k automatickému vygenerování několika snímků výzev, a to provedením generování rozšířeného načítání.

Učení s několika snímky má dva hlavní případy použití:

Ladění LLM – protože to může přidat do znalostí modelu, může několik snímků učení zlepšit výkon modelu. To také způsobí, že model vytvoří více tokenů než učení s nulovým snímkem, což může být nakonec znemožněné nebo dokonce neproveditelné. Pokud ale váš LLM ještě není vyladěný, nebudete mít dobrý výkon s výzvami s nulovým snímkem a učení s několika snímky je zaručené.
Řešení problémů s výkonem – učení s několika snímky můžete použít jako následné učení s nulovým snímkem. V tomto případě použijete učení s nulovým snímkem k vytvoření standardních hodnot výkonu a potom experimentujete s několika snímky učení na základě výzev s nulovým snímkem, které jste použili. To vám umožní přidat do znalostí modelu, jakmile uvidíte, jak aktuálně reaguje, takže můžete iterovat a zlepšit výkon a zároveň minimalizovat počet tokenů, které zavádíte.

Upozornění

Ukázkové učení nefunguje dobře u složitých úloh zdůvodnění. Přidání pokynů ale může pomoct tento postup vyřešit.
Několik snímků učení vyžaduje vytvoření dlouhých výzev. Výzvy s velkým počtem tokenů můžou zvýšit výpočet a latenci. To obvykle znamená zvýšené náklady. Existuje také omezení délky výzev.
Když použijete několik příkladů, může se model naučit nepravdivé vzory, například "Mínění je dvakrát tak pravděpodobné, že budou pozitivní než negativní".

Sdílet prostřednictvím

Učení s nulovým snímkem a několika snímky

Případy použití učení s nulovým snímkem

Případy použití učení s několika snímky

Upozornění

Další materiály

Sdílet prostřednictvím

Učení s nulovým snímkem a několika snímky

Případy použití učení s nulovým snímkem

Případy použití učení s několika snímky

Upozornění

Související obsah

Další materiály