Bevezetés a prompt mérnöki tevékenységbe

Cikk
03/29/2024

Az OpenAI GPT-3, GPT-3.5 és GPT-4 modellje parancssor-alapú. A parancssor-alapú modellek esetében a felhasználó szöveges üzenetek beírásával kezeli a modellt, amely a szöveg kiegészítésével válaszol. Ezzel a kiegészítéssel a modell a bevitt szöveget folytatja.

Bár ezek a modellek rendkívül hatékonyak, a viselkedésük nagyon érzékeny a bevitelre. Emiatt fontos, fejlesztendő képesség a bemenő szöveges üzenet elkészítése.

A gyors építés nehéz lehet. A gyakorlatban a kérés úgy működik, hogy a modell súlyait a kívánt feladat elvégzéséhez konfigurálja, de ez inkább művészet, mint tudomány, gyakran tapasztalatot és intuíciót igényel egy sikeres kérés létrehozásához. A cikk célja, hogy segítséget nyújtsunk a tanulási folyamat megkezdéséhez. Megkísérli rögzíteni az összes GPT-modellre vonatkozó általános fogalmakat és mintákat. Fontos azonban tisztában lenni azzal, hogy minden modell eltérően viselkedik, ezért előfordulhat, hogy a tanulás nem minden modellre egyformán érvényes.

Alapvető beállítások

Ez a szakasz a GPT-kérések alapfogalmait és elemeit ismerteti.

A szöveges kérdések azt jelzik, hogy a felhasználók hogyan használják a GPT-modelleket. Az összes generatív nyelvi modellhez hasonlóan a GPT-modellek is megpróbálják létrehozni a következő szavak sorozatát, amelyek valószínűleg az előző szövegből származnak. Ez olyan, mintha azt mondjuk , mi az első dolog, ami eszembe jut, amikor azt mondom <prompt>?. Az alábbi példák ezt a viselkedést mutatják be. Tekintettel a híres tartalom első szavaira, a modell képes pontosan folytatni a szöveget.

Adatkérés	Befejezése
Négy pontszám és hét évvel ezelőtt a	apák hoztak létre ezen a kontinensen, egy új nemzet, fogant a Liberty, és elkötelezett annak a javaslatnak, hogy minden ember egyenlő. [...]
"Hívjon Ishmaelnek."	"Néhány évvel ezelőtt – nem is bánom, hogy pontosan mennyi ideig – kevés pénz volt a táskámban, és semmi különös, ami érdekelne a parton, azt hittem, hogy egy kicsit vitorlázok, és látom a vízes részét a világnak." [...]

Az összetettebb kérések kialakítása során hasznos, ha ezt az alapvető viselkedést szem előtt tartja. Függetlenül a kapott kéréstől, a modell egyszerűen válaszol arra, amit a legvalószínűbbnek határoz meg (a betanítási adatok és a betanítási célok alapján). Ha kérdést tesz fel a kérdésben, a modell nem egy külön "Q&A" kód elérési útját követi, hanem inkább úgy tűnik, hogy választ ad a kérdésre, mert a válasz a legvalószínűbb válasz az adott kérdésre bemenetként.

Összetevők kérése

Ha a Completion API-t használja, miközben nincs különbség a parancssor különböző részei között, akkor is hasznos lehet a tanuláshoz és a vitafórumhoz az alapul szolgáló parancssori összetevők azonosítása érdekében. A Csevegés befejezése API-val a parancssor különböző szakaszait küldi el az API-nak a társított szerepkörökkel rendelkező szótárak tömbje formájában: rendszer, felhasználó és asszisztens. Ez az útmutató általánosabban foglalkozik azzal, hogyan gondolkodhat a gyors építésről ahelyett, hogy az egyik API-ra jellemző, a másikhoz kapcsolódó előíró útmutatást nyújtanánk.

Azt is fontos megérteni, hogy bár lehetnek más érvényes módszerek is a kérések eloszlatására, ennek a lebontásnak a célja, hogy viszonylag egyszerű módot biztosítson a gyors építésre. A Completion API-val az összes összetevő nem kötelező, de legalább egynek jelen kell lennie, és a legtöbb kérés több összetevőt is tartalmaz. Az összetevők között szürke terület is lehet. Az alábbi sorrend nagyjából megfelel az egyes összetevők felhasználási módjának, a legtöbbtől a legkevésbé.

Utasítások

Az utasítások valószínűleg a leggyakrabban használt parancssori összetevők. Az utasítások egyszerűen a következők: utasítások a modellhez a teendőkről. Bár a gyakorlatban egyszerűek, a gyakorlatban összetettek lehetnek. Az alábbi táblázat ezt egyszerű és összetettebb utasítások két különböző formában történő megjelenítésével szemlélteti.

Utasítás típusa	Adatkérés	Befejezése
Egyszerű utasítások	Írjon bevezetőt egy heti hírlevélhez.	Üdvözöljük heti hírlevelünkben. Ezen a héten különös hangsúlyt fektetünk a termelékenységre. Tippeket és trükköket osztunk meg arról, hogyan lehet hatékony az életed minden területén. Reméljük, élvezni, és kérjük, ossza meg barátaival!
Összetett utasítások	Írjon bevezetőt egy contoso nevű heti hírlevélhez. Meg kell említeni a nagy minden kéz találkozó volt a múlt héten, és köszönöm a csapat minden kemény munkát az elmúlt néhány hónapban.	Üdvözöljük a Contoso heti hírlevelében! A múlt héten volt egy nagyszerű kézértekezletünk, és szeretném megköszönni a csapatnak az elmúlt hónapok kemény munkáját. Nagyon várjuk a fényes jövőt, és bízom benne, hogy csapatunk elkötelezettségével és elkötelezettségével nagyszerű dolgokat fogunk elérni. Köszönjük, hogy tagja volt a csapatunknak, és nagyon várom, hogy az elkövetkező hetekben és hónapokban együtt dolgozhassak önökkel. Üdvözlet: [Az Ön neve].
Összetett utasítások	Írjon bevezetőt egy heti hírlevélhez, az alábbiakat is beleértve: - A cégem neve contoso - Egy ragyogó üdvözlés - Köszönet a csapatnak a kemény munkáért néhány kemény hónap alatt - Pozitív kilátások a következő negyedévre - Az SLT aláírása	Hello Contoso csapat! Meg akartam köszönni az elmúlt hónapok kemény munkáját. Kemény pár hónap volt, de mindannyian összehoztak és csodálatos munkát végeztek. Nagyon büszke vagyok magára. Előretekintve a következő negyedévre, nagyon pozitívnak érzem magam. Azt hiszem, nagyszerű dolgokat fogunk elérni. Még egyszer köszönöm, a vezető vezető csapat.

Elsődleges tartalom

Az elsődleges tartalom olyan szövegre utal, amelyet a modell feldolgoz vagy átalakít. Az elsődleges tartalmat általában az utasításokhoz kapcsolódóan használják. Egy egyszerű példa a nyelvfordítás. Az alábbi példában az angol szöveg lesz az elsődleges tartalom, míg a "Fordítás franciára:" utasítás.

Adatkérés	Befejezése
Meg tudja mondani, hogyan jutok el a múzeumba? Fordítás franciára:	`Pouvez-vous s'il vous plaît me dire comment aller au musée?`

Az elsődleges tartalom is hosszabb lehet. Az alábbi példában az elsődleges tartalom a Wikipedia-bejegyzés bevezető szakasza az idő összetettségéről, amely közel 300 szó hosszú. Ezt a tartalmat rövidítettük a táblázatunkban a könnyű megjelenítés érdekében.

Adatkérés	Befejezése
A számítástechnikában az idő összetettsége az a számítási összetettség, amely az algoritmus futtatásához szükséges számítógépidőt írja le. Az idő összetettségét általában [...] Foglalja össze az előző szöveget néhány mondatban:	Az idő összetettsége azt méri, hogy mennyi ideig tart egy algoritmus futtatása. Általában a bemenet méretének függvényeként van kifejezve. A leggyakoribb mérték a legrosszabb esetben az idő összetettsége, amely az adott méretű bemenetekhez szükséges maximális időmennyiség.
A számítástechnikában az idő összetettsége az a számítási összetettség, amely az algoritmus futtatásához szükséges számítógépidőt írja le. Az idő összetettségét általában [...] `TL;DR` (Túl hosszú nem olvasta)	Az algoritmusok időösszetettsége az algoritmus futtatásához szükséges idő. Az idő összetettségét általában az algoritmus által végrehajtott elemi műveletek számának megszámlálásával becsülik meg, feltételezve, hogy minden elemi művelet végrehajtása meghatározott ideig tart. Az idő összetettségét általában a bemenet méretének függvényeként fejezik ki.

A GPT-modellek a strukturált elsődleges tartalmakat is képesek kezelni. Az alábbi példában a belgiumi sörökről szóló TSV (a jelen cikkben való megjelenítéshez rövidítve) a rendszer a kérés részeként továbbítja a modellnek. Képes a tartalom megfelelő értelmezésére és az adatokkal kapcsolatos kérdések megválaszolására.

Adatkérés	Befejezése
`Belgian Beer Brands` `Beer name Beer style color ABV Brewery` `"Chimay Gold: ""Doree""" trappist pale ale gold 4.80% Chimay Brewery (official trappist)` `"Chimay Blue: ""Grande Reserve""" trappist dark ale dark 9.00%` [...] A fenti táblázatra hivatkozva hány sör kevesebb, mint 6% ABV?	A táblázatban 10 olyan sör van, amely kevesebb, mint 6% ABV.

Példák

A sikeres kérések gyakran az "egy lövéses" vagy a "kevés lövésű" tanulás gyakorlatára támaszkodnak. Ez arra utal, hogy a modell kívánt viselkedésére egy vagy több példát is be kell illeszteni, általában bemeneti és kimeneti párokat is belefoglalva. Ez nem abban az értelemben tanulható meg, hogy a modell véglegesen megváltozik, hanem az, hogy a példák jobb feltételként konfigurálják a modellt, hogy a kívánt módon válaszoljon csak az aktuális következtetésre. A példák nélküli kérések használatát néha "nulla lövésű" tanulásnak is nevezik. Vegye figyelembe, hogy a Csevegés befejezése API-val a rendszer általában néhány képből álló tanulási példákat ad hozzá az üzenettömbhöz, például felhasználói/asszisztensi interakciók formájában a kezdeti rendszerüzenet után.

Tanulás típus	Adatkérés	Befejezése
Nulla lövés	Címsor: Edző magabiztos sérülés nem kisiklik Warriors Témakör:	Az edző biztos benne, hogy a sérülés nem fogja kisiklatni a Warriors szezonját. A csapat továbbra is a céljaikra összpontosít, és továbbra is keményen dolgoznak a célok elérése érdekében.
Kevés lövés	Címsor: Twins 'Correa használata opt-out, teszt ingyenes ügynökség Témakör: Baseball Címsor: Katar World Cup, hogy zónák kijózanítás fel Témakör: Foci Címsor: Yates: Fantasy futball intel a hét 6 Témakör: Labdarúgás Címsor: Edző magabiztos sérülés nem kisiklik Warriors Témakör:	Kosárlabda

A fenti példa a kevés lövéses tanulás hasznosságát szemlélteti. A példák nélkül úgy tűnik, hogy a modell kitalálja a kívánt viselkedést, míg a példák tisztán mutatják a modell működését. Ez a modell erejét is szemlélteti, és arra is következtethet, hogy milyen címkekategóriát szeretne használni, még akkor is, ha a példákban nem szerepel "kosárlabda" címke.

Végszó

A cues a modell kimenetének "jumpstart"-jaként működik, segítve a modellt a kívánt kimenetre irányítani. Ez gyakran egy előtag, amelyre a modell építhet. Az alábbi példában a szövegegység fő elemeinek belefoglalására szolgáló végszót mutatjuk be. A jeleket gyakran használják az utasítások mellett, de nem mindig. Az alábbi példákban a modell egy hosszú bejelentési e-mail összegzésére szolgál. A rendszer az egyik esetben a modell kimenetének fókuszba helyezésére, a másikban pedig egy adott kimeneti formátum (listajelpontok) javaslatára szolgál.

A Csevegés befejezése API kontextusában az utasítások a rendszerüzenet formájában jelennek meg, és néhány példa a felhasználó/asszisztens interakcióinak sorozatával jelzi a modellt.

Cues-k száma	Adatkérés	Befejezése
0	A teljesítményértékelések a Contoso teljesítmény- és fejlesztési megközelítésének alapvető összetevői. [...] A fenti e-mail összegzése:	Ennek az e-mailnek az a célja, hogy tájékoztassa az alkalmazottakat a teljesítményértékelési felület legutóbbi változásairól, ami a Contoso Teljesítmény és fejlesztési megközelítésének része. A módosítások közé tartozik a továbbfejlesztett struktúra, az eszközön belüli frissített felhasználói élmény és a szűrt kérések. Emellett már elérhető egy választható Beszélgetésindítók szakasz is, amellyel az alkalmazottak megjelölhetik a vezetőkkel megbeszélni kívánt témaköröket.
0	A teljesítményértékelések a Contoso teljesítmény- és fejlesztési megközelítésének alapvető összetevői. [...] A fenti e-mail összegzése: Az üzenet legfontosabb eleme a következő:	hogy a Contoso javítja a teljesítményértékelési élményt azáltal, hogy jobban összpontosít az alapvető prioritásokra, elvárásokra és hatásokra. Emellett tippekkel, erőforrásokkal és útmutatásokkal frissítik az eszközön belüli felhasználói élményt. Végül útmutatást adnak a vállalati szintű alapvető prioritások aktiválásához.
2	A teljesítményértékelések a Contoso teljesítmény- és fejlesztési megközelítésének alapvető összetevői. [...] A fenti e-mail összegzése: Kulcsfontosságú pontok: •	A Contoso az alkalmazottak visszajelzései alapján módosítja a teljesítményértékelési élményt. • A változások új fókuszba helyezik az alapvető prioritásokat, elvárásokat és hatásokat; frissített felhasználói élmény; és új útmutatást a vállalati szintű alapvető prioritásokról. • A teljesítményértékelések ideje a múltbeli teljesítmény és a tanulás, valamint a jövőbeli prioritások és növekedési lehetőségek tervezése. • Az alkalmazottaknak és a vezetőknek a teljesítményértékelési értekezlet előtt megjegyzéseket kell írniuk. • Évente legalább két teljesítményértékelésnek kell lennie. • Az egyes felülvizsgálatok időbefektetésének nagyjából azonosnak kell maradnia.

Támogató tartalom

A támogató tartalom olyan információ, amelyet a modell felhasználhat a kimenet valamilyen módon történő befolyásolására. Abban különbözik az elsődleges tartalomtól, hogy nem ez a tevékenység fő célja, de általában az elsődleges tartalommal együtt használják. Ilyenek például a környezetfüggő adatok, például az aktuális dátum, a felhasználó neve, a felhasználói beállítások stb. Az alábbi példa támogató tartalommal segíti a felhasználó számára tervezett műhelyek rendszerezését. A támogató (fontos témakörök) nélkül a modell egyszerűen felsorolja a workshopokat (csonkolt a megjelenítéshez), amikor értesül a fontos témákról, a modell képes pontosan csoportosítani az értekezleteket.

Támogató tartalom	Adatkérés	Befejezése
A következő nélkül:	Műhelylista: Cím leírása Tervezés Workshop Kickoff Kérjük, csatlakozzon hozzánk, hogy indítsa el a műhely! A vezetőktől a csoportközi prioritásokról és a jövő évi tanulásról hallhat. A meghívást erre az eseményre már elküldte mindenkinek a [...] A fenti workshopok összegzése témakör szerint csoportosítva:	Műhelylista: Tervezési workshop – bevezetés -Tervezési műhely burkolás - Core MeetUp - Ügyfélvezérelt perspektívák -Hatás és fő fókuszterületek -Ajánlott eljárások -Az alkalmazás bevezetésének felgyorsítása [...]
With	Műhelylista: Cím leírása Tervezés Workshop Kickoff Kérjük, csatlakozzon hozzánk, hogy indítsa el a műhely! A vezetőktől a csoportközi prioritásokról és a jövő évi tanulásról hallhat. A meghívást erre az eseményre már elküldte mindenkinek a [...] Fontos témakörök: parancssori tervezés, keresés, GPT-modellek Összegezze a fenti workshopokat, a fontos témakörök szerint csoportosítva:	1. Parancssori tervezés: – Új gyorstervezési tippek - A gyors tervezés művészete 2. Keresés: -Bevezetés a vektorkeresésbe beágyazással 3. GPT-modellek: - Bevezetés a GPT-4-be - GPT-35-Turbo részletes.

Ajánlott eljárások

Legyen konkrét. Lehetőleg kerülje a kétértelműséget. Határolja körül a témakört.
Legyen leíró. Használjon analógiákat.
Dupla lefelé. Előfordulhat, hogy ismételnie kell magát a modellben. Adja meg az utasításokat az elsődleges tartalom előtt és az után is, használjon utasítást és egy célzást stb.
A rendelés számít. A modell információinak beadási sorrendje hatással lehet a kimenetre. A kimenetben különbséget tehet, ha útmutatást ad a tartalom elé ("összegzi a következőket...") vagy utána ("összegzi a fentieket..."). Már néhány példa sorrendje is számíthat. Ez az új információk előnyben részesítéseként ismert jelenség.
Adjon egy "out" értéket a modellnek. Néha hasznos lehet alternatív útvonalat adni a modellnek, ha nem tudja elvégezni a hozzárendelt feladatot. Ha például kérdést tesz fel egy szövegrészen, például a "nem található" válaszsal válaszolhat, ha a válasz nem jelenik meg. Ez segíthet a modellnek elkerülni a hamis válaszok generálását.

Területhatékonyság

Bár a bemenet mérete a GPT-modellek minden új generációjában nagyobb, továbbra is előfordulhat, hogy a megadott adatmennyiség nagyobb a modell által kezelhetőnél. A GPT-modellek "jogkivonatokra" bontják a szavakat. Míg a gyakori több szótagos szavak gyakran egyetlen jogkivonatok, a kevésbé gyakori szavak szótagokban vannak törve. A jogkivonatok néha ellentétesek lehetnek, ahogy az alábbi példában látható, amely a különböző dátumformátumok jogkivonat-határait mutatja be. Ebben az esetben a teljes hónap helyesírása hatékonyabb, mint egy teljes numerikus dátum. A jelenlegi jogkivonat-támogatás a korábbi GPT-3 modellekkel rendelkező 2000 tokentől akár 32 768 jogkivonatig terjed a legújabb GPT-4 modell 32k-s verziójával.

Mivel ez a korlátozott terület, fontos, hogy a lehető leghatékonyabban használják.

Táblázatok – Ahogyan az előző szakaszban bemutatott példákban is látható, a GPT-modellek elég könnyen megérthetik a táblázatos formázott adatokat. Ez a hely hatékony módja lehet az adatok befoglalásának, nem pedig az összes névvel ellátott mező (például JSON) elé.
Térköz – Az egymást követő térközök különálló jogkivonatokként vannak kezelve, amelyek könnyen elpazarlhatják a helyet. A szó előtti szóközöket viszont általában a szóéval megegyező jogkivonat részeként kezelik. Gondosan figyelje meg a térköz használatát, és ne használjon írásjelet, ha csak egy szóközt használ.

Következő lépések

További információ az Azure OpenAI-ról.

Megosztás a következőn keresztül: