Megosztás a következőn keresztül:


Parancssori tervezési technikák

Az OpenAI GPT-3, GPT-3.5, GPT-4 és GPT-4o modelljei parancssori alapúak. A parancssor-alapú modellek esetében a felhasználó szöveges üzenetek beírásával kezeli a modellt, amely a szöveg kiegészítésével válaszol. Ezzel a kiegészítéssel a modell a bevitt szöveget folytatja.

Bár ezek a modellek rendkívül hatékonyak, a viselkedésük nagyon érzékeny a bevitelre. Emiatt fontos, fejlesztendő képesség a bemenő szöveges üzenet elkészítése.

A gyors építés nehéz lehet. A gyakorlatban a kérés úgy működik, hogy a modell súlyait a kívánt feladat elvégzéséhez konfigurálja, de ez inkább művészet, mint tudomány, gyakran tapasztalatot és intuíciót igényel egy sikeres kérés létrehozásához. A cikk célja, hogy segítséget nyújtsunk a tanulási folyamat megkezdéséhez. Megkísérli rögzíteni az összes GPT-modellre vonatkozó általános fogalmakat és mintákat. Fontos azonban tisztában lenni azzal, hogy minden modell eltérően viselkedik, ezért előfordulhat, hogy a tanulás nem minden modellre egyformán érvényes.

Alapvető beállítások

Ez a szakasz a GPT-kérések alapfogalmait és elemeit ismerteti.

A szöveges kérdések azt jelzik, hogy a felhasználók hogyan használják a GPT-modelleket. Az összes generatív nyelvi modellhez hasonlóan a GPT-modellek is megpróbálják létrehozni a következő szavak sorozatát, amelyek valószínűleg az előző szövegből származnak. Mintha azt mondjuk , mi az első dolog, ami eszembe jut, amikor azt mondom <prompt>? Az alábbi példák ezt a viselkedést mutatják be. Tekintettel a híres tartalom első szavaira, a modell képes pontosan folytatni a szöveget.

Felszólítás Teljesítés
Négy pontszám és hét évvel ezelőtt a apák hoztak létre ezen a kontinensen, egy új nemzet, fogant a Liberty, és elkötelezett annak a javaslatnak, hogy minden ember egyenlő. […]
"Hívjon Ishmaelnek." "Néhány évvel ezelőtt – nem is bánom, hogy pontosan mennyi ideig – kevés pénz volt a táskámban, és semmi különös, ami érdekelne a parton, azt hittem, hogy egy kicsit vitorlázok, és látom a vízes részét a világnak." […]

Az összetettebb kérések kialakítása során hasznos, ha ezt az alapvető viselkedést szem előtt tartja. Függetlenül a kapott kéréstől, a modell egyszerűen válaszol arra, amit a legvalószínűbbnek határoz meg (a betanítási adatok és a betanítási célok alapján). Ha kérdést tesz fel a kérdésben, a modell nem egy külön "Q&A" kód elérési útját követi, hanem inkább úgy tűnik, hogy választ ad a kérdésre, mert a válasz a legvalószínűbb válasz az adott kérdésre bemenetként.

Összetevők kérése

Ha a Completion API-t használja, miközben nincs különbség a parancssor különböző részei között, akkor is hasznos lehet a tanuláshoz és a vitafórumhoz az alapul szolgáló parancssori összetevők azonosítása érdekében. A Csevegés befejezése API-val a parancssor különböző szakaszait küldi el az API-nak a társított szerepkörökkel rendelkező szótárak tömbje formájában: rendszer, felhasználó és asszisztens. Ez az útmutató általánosabban foglalkozik azzal, hogyan gondolkodhat a gyors építésről ahelyett, hogy az egyik API-ra jellemző, a másikhoz kapcsolódó előíró útmutatást nyújtanánk.

Azt is fontos megérteni, hogy bár lehetnek más érvényes módszerek is a kérések eloszlatására, ennek a lebontásnak a célja, hogy viszonylag egyszerű módot biztosítson a gyors építésre. A Completion API-val az összes összetevő nem kötelező, de legalább egynek jelen kell lennie, és a legtöbb kérés több összetevőt is tartalmaz. Az összetevők között szürke terület is lehet. Az alábbi sorrend nagyjából megfelel az egyes összetevők felhasználási módjának, a legtöbbtől a legkevésbé.

Utasítások

Az utasítások valószínűleg a leggyakrabban használt parancssori összetevők. Az utasítások egyszerűen a következők: utasítások a modellhez a teendőkről. Bár a gyakorlatban egyszerűek, a gyakorlatban összetettek lehetnek. Az alábbi táblázat ezt egyszerű és összetettebb utasítások két különböző formában történő megjelenítésével szemlélteti.

Utasítás típusa Felszólítás Teljesítés
Egyszerű utasítások Írjon bevezetőt egy heti hírlevélhez. Üdvözöljük heti hírlevelünkben. Ezen a héten különös hangsúlyt fektetünk a termelékenységre. Tippeket és trükköket osztunk meg arról, hogyan lehet hatékony az életed minden területén. Reméljük, élvezni, és kérjük, ossza meg barátaival!
Összetett utasítások Írjon bevezetőt egy contoso nevű heti hírlevélhez. Meg kell említeni a nagy minden kéz találkozó volt a múlt héten, és köszönöm a csapat minden kemény munkát az elmúlt néhány hónapban. Üdvözöljük a Contoso heti hírlevelében! A múlt héten volt egy nagyszerű kézértekezletünk, és szeretném megköszönni a csapatnak az elmúlt hónapok kemény munkáját. Nagyon várjuk a fényes jövőt, és bízom benne, hogy csapatunk elkötelezettségével és elkötelezettségével nagyszerű dolgokat fogunk elérni. Köszönjük, hogy tagja volt a csapatunknak, és nagyon várom, hogy az elkövetkező hetekben és hónapokban együtt dolgozhassak önökkel. Üdvözlet: [Az Ön neve].
Összetett utasítások Írjon bevezetőt egy heti hírlevélhez, az alábbiakat is beleértve:
- A cégem neve contoso
- Egy ragyogó üdvözlés
- Köszönet a csapatnak a kemény munkáért néhány kemény hónap alatt
- Pozitív kilátások a következő negyedévre
- Az SLT aláírása
Hello Contoso csapat! Meg akartam köszönni az elmúlt hónapok kemény munkáját. Kemény pár hónap volt, de mindannyian összehoztak és csodálatos munkát végeztek. Nagyon büszke vagyok magára. Előretekintve a következő negyedévre, nagyon pozitívnak érzem magam. Azt hiszem, nagyszerű dolgokat fogunk elérni. Még egyszer köszönöm, a vezető vezető csapat.

Elsődleges tartalom

Az elsődleges tartalom olyan szövegre utal, amelyet a modell feldolgoz vagy átalakít. Az elsődleges tartalmat általában az utasításokhoz kapcsolódóan használják. Egy egyszerű példa a nyelvfordítás. Az alábbi példában az angol szöveg lesz az elsődleges tartalom, míg a "Fordítás franciára:" utasítás.

Felszólítás Teljesítés
Meg tudja mondani, hogyan jutok el a múzeumba?
Fordítás franciára:
Pouvez-vous s'il vous plaît me dire comment aller au musée?

Az elsődleges tartalom is hosszabb lehet. Az alábbi példában az elsődleges tartalom a Wikipedia-bejegyzés bevezető szakasza az idő összetettségéről, amely közel 300 szó hosszú. Ezt a tartalmat rövidítettük a táblázatunkban a könnyű megjelenítés érdekében.

Felszólítás Teljesítés
A számítástechnikában az idő összetettsége az a számítási összetettség, amely az algoritmus futtatásához szükséges számítógépidőt írja le. Az idő összetettségét általában [...]
Foglalja össze az előző szöveget néhány mondatban:
Az idő összetettsége azt méri, hogy mennyi ideig tart egy algoritmus futtatása. Általában a bemenet méretének függvényeként van kifejezve. A leggyakoribb mérték a legrosszabb esetben az idő összetettsége, amely az adott méretű bemenetekhez szükséges maximális időmennyiség.
A számítástechnikában az idő összetettsége az a számítási összetettség, amely az algoritmus futtatásához szükséges számítógépidőt írja le. Az idő összetettségét általában [...]
TL;DR (Túl hosszú nem olvasta)
Az algoritmusok időösszetettsége az algoritmus futtatásához szükséges idő. Az idő összetettségét általában az algoritmus által végrehajtott elemi műveletek számának megszámlálásával becsülik meg, feltételezve, hogy minden elemi művelet végrehajtása meghatározott ideig tart. Az idő összetettségét általában a bemenet méretének függvényeként fejezik ki.

A GPT-modellek a strukturált elsődleges tartalmakat is képesek kezelni. Az alábbi példában a belgiumi sörökről szóló TSV (a jelen cikkben való megjelenítéshez rövidítve) a rendszer a kérés részeként továbbítja a modellnek. Képes a tartalom megfelelő értelmezésére és az adatokkal kapcsolatos kérdések megválaszolására.

Felszólítás Teljesítés
Belgian Beer Brands
Beer name Beer style color ABV Brewery
"Chimay Gold: ""Doree""" trappist pale ale gold 4.80% Chimay Brewery (official trappist)
"Chimay Blue: ""Grande Reserve""" trappist dark ale dark 9.00%
[…]
A fenti táblázatra hivatkozva hány sör kevesebb, mint 6% ABV?
A táblázatban 10 olyan sör van, amely kevesebb, mint 6% ABV.

Példák

A sikeres kérések gyakran az "egy lövéses" vagy a "kevés lövésű" tanulás gyakorlatára támaszkodnak. Ez arra utal, hogy a modell kívánt viselkedésére egy vagy több példát is be kell illeszteni, általában bemeneti és kimeneti párokat is belefoglalva. Ez nem abban az értelemben tanulható meg, hogy a modell véglegesen megváltozik, hanem az, hogy a példák jobb feltételként konfigurálják a modellt, hogy a kívánt módon válaszoljon csak az aktuális következtetésre. A példák nélküli kérések használatát néha "nulla lövésű" tanulásnak is nevezik. Vegye figyelembe, hogy a Csevegés befejezése API-val a rendszer általában néhány képből álló tanulási példákat ad hozzá az üzenettömbhöz, például felhasználói/asszisztensi interakciók formájában a kezdeti rendszerüzenet után.

Tanulási típus Felszólítás Teljesítés
Nulla lövés Címsor: Edző magabiztos sérülés nem kisiklik Warriors
Témakör:
Az edző biztos benne, hogy a sérülés nem fogja kisiklatni a Warriors szezonját. A csapat továbbra is a céljaikra összpontosít, és továbbra is keményen dolgoznak a célok elérése érdekében.
Kevés lövés Címsor: Twins 'Correa használata opt-out, teszt ingyenes ügynökség
Témakör: Baseball
Címsor: Katar World Cup, hogy zónák kijózanítás fel
Témakör: Foci
Címsor: Yates: Fantasy futball intel a hét 6
Témakör: Labdarúgás
Címsor: Edző magabiztos sérülés nem kisiklik Warriors
Témakör:
Kosárlabda

A fenti példa a kevés lövéses tanulás hasznosságát szemlélteti. A példák nélkül úgy tűnik, hogy a modell kitalálja a kívánt viselkedést, míg a példák tisztán mutatják a modell működését. Ez a modell erejét is szemlélteti, és arra is következtethet, hogy milyen címkekategóriát szeretne használni, még akkor is, ha a példákban nem szerepel "kosárlabda" címke.

Dákó

A cues a modell kimenetének "jumpstart"-jaként működik, segítve a modellt a kívánt kimenetre irányítani. Ez gyakran egy előtag, amelyre a modell építhet. Az alábbi példában a szövegegység fő elemeinek belefoglalására szolgáló végszót mutatjuk be. A jeleket gyakran használják az utasítások mellett, de nem mindig. Az alábbi példákban a modell egy hosszú bejelentési e-mail összegzésére szolgál. A rendszer az egyik esetben a modell kimenetének fókuszba helyezésére, a másikban pedig egy adott kimeneti formátum (listajelpontok) javaslatára szolgál.

A Csevegés befejezése API kontextusában az utasítások a rendszerüzenet formájában jelennek meg, és néhány példa a felhasználó/asszisztens interakcióinak sorozatával jelzi a modellt.

Cues-k száma Felszólítás Teljesítés
0 A teljesítményértékelések a Contoso teljesítmény- és fejlesztési megközelítésének alapvető összetevői. […]
A fenti e-mail összegzése:
Ennek az e-mailnek az a célja, hogy tájékoztassa az alkalmazottakat a teljesítményértékelési felület legutóbbi változásairól, ami a Contoso Teljesítmény és fejlesztési megközelítésének része. A módosítások közé tartozik a továbbfejlesztett struktúra, az eszközön belüli frissített felhasználói élmény és a szűrt kérések. Emellett már elérhető egy választható Beszélgetésindítók szakasz is, amellyel az alkalmazottak megjelölhetik a vezetőkkel megbeszélni kívánt témaköröket.
0 A teljesítményértékelések a Contoso teljesítmény- és fejlesztési megközelítésének alapvető összetevői. […]
A fenti e-mail összegzése:
Az üzenet legfontosabb eleme a következő:
hogy a Contoso javítja a teljesítményértékelési élményt azáltal, hogy jobban összpontosít az alapvető prioritásokra, elvárásokra és hatásokra. Emellett tippekkel, erőforrásokkal és útmutatásokkal frissítik az eszközön belüli felhasználói élményt. Végül útmutatást adnak a vállalati szintű alapvető prioritások aktiválásához.
2 A teljesítményértékelések a Contoso teljesítmény- és fejlesztési megközelítésének alapvető összetevői. […]
A fenti e-mail összegzése:
Kulcsfontosságú pontok:
A Contoso az alkalmazottak visszajelzései alapján módosítja a teljesítményértékelési élményt.
• A változások új fókuszba helyezik az alapvető prioritásokat, elvárásokat és hatásokat; frissített felhasználói élmény; és új útmutatást a vállalati szintű alapvető prioritásokról.
• A teljesítményértékelések ideje a múltbeli teljesítmény és a tanulás, valamint a jövőbeli prioritások és növekedési lehetőségek tervezése.
• Az alkalmazottaknak és a vezetőknek a teljesítményértékelési értekezlet előtt megjegyzéseket kell írniuk.
• Évente legalább két teljesítményértékelésnek kell lennie.
• Az egyes felülvizsgálatok időbefektetésének nagyjából azonosnak kell maradnia.

Támogató tartalom

A támogató tartalom olyan információ, amelyet a modell felhasználhat a kimenet valamilyen módon történő befolyásolására. Abban különbözik az elsődleges tartalomtól, hogy nem ez a tevékenység fő célja, de általában az elsődleges tartalommal együtt használják. Ilyenek például a környezetfüggő adatok, például az aktuális dátum, a felhasználó neve, a felhasználói beállítások stb. Az alábbi példa támogató tartalommal segíti a felhasználó számára tervezett műhelyek rendszerezését. A támogató (fontos témakörök) nélkül a modell egyszerűen felsorolja a workshopokat (csonkolt a megjelenítéshez), amikor értesül a fontos témákról, a modell képes pontosan csoportosítani az értekezleteket.

Támogató tartalom Felszólítás Teljesítés
A következő nélkül: Műhelylista:
Cím leírása
Tervezés Workshop Kickoff Kérjük, csatlakozzon hozzánk, hogy indítsa el a műhely! A vezetőktől a csoportközi prioritásokról és a jövő évi tanulásról hallhat. A meghívást erre az eseményre már elküldte mindenkinek a [...]
A fenti workshopok összegzése témakör szerint csoportosítva:
Műhelylista:
Tervezési workshop – bevezetés
-Tervezési műhely burkolás
- Core MeetUp
- Ügyfélvezérelt perspektívák
-Hatás és fő fókuszterületek
-Ajánlott eljárások
-Az alkalmazás bevezetésének felgyorsítása [...]
With Műhelylista:
Cím leírása
Tervezés Workshop Kickoff Kérjük, csatlakozzon hozzánk, hogy indítsa el a műhely! A vezetőktől a csoportközi prioritásokról és a jövő évi tanulásról hallhat. A meghívást erre az eseményre már elküldte mindenkinek a [...]
Fontos témakörök: parancssori tervezés, keresés, GPT-modellek
Összegezze a fenti workshopokat, a fontos témakörök szerint csoportosítva:
1. Parancssori tervezés:
– Új gyorstervezési tippek
- A gyors tervezés művészete
2. Keresés:
-Bevezetés a vektorkeresésbe beágyazással
3. GPT-modellek:
- Bevezetés a GPT-4-be
- GPT-35-Turbo részletes.

Forgatókönyv-specifikus útmutató

Bár a gyorstervezés alapelvei számos különböző modelltípusra általánosíthatók, bizonyos modellek speciális parancssori struktúrát várnak. Az Azure OpenAI GPT-modellek esetében jelenleg két különböző API van, amelyekben a parancssori tervezés kerül előtérbe:

  • Csevegés befejezése API.
  • Befejezési API.

Minden API-hoz eltérően kell formázni a bemeneti adatokat, ami hatással van az általános parancssori kialakításra. A Chat Completion API támogatja a GPT-35-Turbo és a GPT-4 modelleket. Ezek a modellek úgy vannak kialakítva, hogy egy adott csevegőszerű átiratban formázott bemenetet használjanak, amelyet egy szótártömbben tárolnak.

A Completion API támogatja a régebbi GPT-3 modelleket, és sokkal rugalmasabb bemeneti követelményekkel rendelkezik, mivel meghatározott formázási szabályok nélküli szöveges sztringet igényel.

Az ebben a szakaszban szereplő technikák a nagy nyelvi modellel (LLM) generált válaszok pontosságának és alapozásának növelésére szolgáló stratégiákat tanítják meg. Fontos azonban megjegyezni, hogy még a gyors tervezés hatékony használata esetén is ellenőriznie kell a modellek által generált válaszokat. Csak azért, mert egy gondosan összeállított kérés jól működött egy adott forgatókönyv esetében, nem feltétlenül jelenti azt, hogy általánosabb lesz bizonyos használati esetekre. Az LLM-ek korlátainak megértése ugyanolyan fontos, mint az erősségeik kihasználásának megértése.

Ez az útmutató nem részletezi a csevegések befejezésének üzenetstruktúrája mögötti mechanikát. Ha nem ismeri a Csevegés befejezése modellek programozott módon való használatát, javasoljuk, hogy először olvassa el a Csevegés befejezése API útmutatóját.

Feljegyzés

Az útmutató jelen szakaszában szereplő összes példát egy alapSZINTŰ GPT-4 modellen teszteltük angol nyelven. Ha a cikk honosított verzióját egy másik nyelven olvassa, ezek a válaszok az angol nyelvű eredmények honosított fordítását jelentik. Ha többet szeretne megtudni a modell kéréséhez használt nyelvtől függő lehetséges korlátozásokról, tekintse meg a Felelős AI átláthatósági megjegyzését.

Néhány lövéses tanulás

A nyelvi modellek új feladatokhoz való igazításának gyakori módja a kevés lövéses tanulás. A kevés képből álló tanulás során a rendszer betanítási példákat biztosít a modell további kontextusának megadására szolgáló kérés részeként.

A Chat Completions API használatakor a Felhasználó és a Segéd közötti üzenetsorozat (amely az új parancssori formátumban íródott) példaként szolgálhat a kevés képből álló tanuláshoz. Ezek a példák arra használhatók, hogy a modell egy bizonyos módon reagáljon, bizonyos viselkedéseket emuláljon, és válaszokat adjon a gyakori kérdésekre.

Rendszerüzenet Néhány példa
Az Assistant egy intelligens csevegőrobot, amely segít a felhasználóknak megválaszolni az adóval kapcsolatos kérdéseiket.
Előírás
- Csak az adókkal kapcsolatos kérdésekre válaszoljon.
- Ha nem biztos a válaszban, akkor azt mondhatja, hogy "Nem tudom" vagy "Nem vagyok benne biztos", és azt javasoljuk, hogy a felhasználók lépjenek az IRS webhelyére további információkért.
Felhasználó – "Mikor kell beszednem az adókat?"
Assistant - "2023-ban április 18-ig be kell fizetnie az adóját. A dátum a szokásos április 15-i határidő után esik, mivel 2023-ban április 15-én szombatra esik. További részletekért lásd: https://www.irs.gov/filing/individuals/when-to-file "

Felhasználó – "Hogyan ellenőrizhetim az adó-visszatérítésem állapotát?"
Asszisztens - "Ellenőrizheti az adó-visszatérítés állapotát a látogatással https://www.irs.gov/refunds "

A fenti táblázat az egyszerű parancssori struktúrát ismerteti, de a pontos parancssori formátum részletes ismertetéséhez tekintse meg a csevegés befejezésének útmutatóját.

Nem csevegési forgatókönyvek

Bár a Csevegés befejezése API többfordulós beszélgetésekhez van optimalizálva, nem csevegési forgatókönyvekhez is használható. Hangulatelemzési forgatókönyv esetén például a következő üzenet használható:

Rendszerüzenet User Segéd
Ön egy asszisztens, aki beszédadatokból származó hangulatelemzésre lett tervezve. A felhasználók szöveges sztringbe illesztik be a szöveget, ön pedig a beszélő válaszának értékelésével válaszol. Ráta 1-10 skálán (10 a legmagasabb). Magyarázza el, miért adták meg ezt a minősítést. szia köszönöm, hogy hívja contoso gyógyszertár, aki én beszélek ma értem a frusztráció mary um meg tudod mondani, hogy pontosan mit próbál elérni OK uh biztosan boldog, hogy ellenőrizze, hogy az Ön számára egy pillanatig kérem, itt látom, hogy volt egy általános formájában lipitor van, hogy a jobb OK uh így látom, hogy az orvos nem írta fel ezeket a gyógyszereket huszonegy ténylegesen OK uh Igen, én boldogan ellenőrizze, hogy az Ön számára uh, mert néha van egy rés a rendszerben, és csak nem kap jelentést, így hadd nézd meg itt csak egy pillanatra, így látom, hogy az orvos ezeket a gyógyszereket felírták Önnek huszonkéttől huszonegyig OK um igen szerint a legújabb nyilvántartások uh által biztosított orvosi hivatal most egy másik gyógyszer metformin lenne Te szereted, hogy megy előre, és töltse ki a receptet, hogy vegye fel egy kis formában ötszáz milligramm uh te nagyon szívesen Mary kérjük, tudassa velünk, ha van valami más, amit tehetünk érted ma. Hangulatértékelés: 8
A szöveg előadója udvariasnak, segítőkésznek és türelmesnek tűnik, miközben az ügyfél aggodalmait kezeli. Időt vesznek igénybe az információk ellenőrzésére, világos magyarázatok megadására és segítségnyújtásra. Az értékelés azonban nem 10, mert a beszélgetés egyes részeiben még mindig fennáll a bizonytalanság, ami nem feltétlenül ad teljes bizalmat az ügyfélnek.

Kezdés egyértelmű utasításokkal

A sorrend információi megjelennek a kérdésben. Ennek az az oka, hogy a GPT-stílusmodellek olyan módon vannak felépítve, amely meghatározza, hogyan dolgozzák fel a bemenetet. Kutatásunk azt javasolja, hogy a modellnek a kérés elején el kell végeznie a feladatot, mielőtt további környezeti információkat vagy példákat oszt meg, segíthet a jobb minőségű kimenetek előállításában.

Feljegyzés

Bár a technika követése továbbra is általánosan ajánlott, ellentétben a korábbi modellverziókkal (GPT-3 és korábbi verziók), a tesztelésünk azt mutatta, hogy a ChatGPT és a GPT-4 modellek modellre adott válasza ugyanaz volt, függetlenül attól, hogy a technikát használják-e. Az alábbi példa esetében azt látjuk, hogy a "Több forrás ... "kitörés" a parancssor elején vagy végén nem okozott változást a végső modell válaszában.

Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában. Az Ön feladata annak ellenőrzése, hogy a következő kódrészletekből származó idézet támogatja-e a "Több forrás említi egy másik nagy kitörés esélyét" állítást.
---
TÖREDÉK
[1] 14 százalék az esélye annak, hogy megaquake eléri Seattle-t, szakértők szerint
SEATTLE - Van egy 14 százalék esélye egy nagyságrendű 9 Cascadia földrengés eléri Seattle-ben a következő 50 évben, az Amerikai Geológiai Felmérés becslései. "Sajnos nem tudunk...

[2] A földrengés szakértői a seattle-i "Really Big One" legújabb kilátásait vizsgáljuk
"Azt mondjuk, hogy körülbelül 14%, hogy egy másik körülbelül nagyság-9 földrengés következik be a következő 50 évben," mondta egy geofizikus a University of Washington ...
---
A "Több forrás említi az esélyét egy másik nagy kitörés" közvetlenül hallgatólagos vagy kimondott a kódrészletek?
Nem, az állítást nem közvetlenül a kódrészletek vagy a kódrészletek jelölik. A kódrészletek említik az esélyt a "megaquake" és a "magnitúdó 9 Cascadia földrengés" eléri Seattle-ben a következő 50 évben, de ne említse meg egy esélyt egy másik nagy kitörés.

Utasítások ismétlése a végén

A modellek érzékenyek lehetnek a recency elfogultságára, ami ebben az összefüggésben azt jelenti, hogy a parancssor végén lévő információk nagyobb hatással lehetnek a kimenetre, mint a parancssor elején lévő információkra. Ezért érdemes kísérletezni az utasítások megismétlésével és a generált válaszra gyakorolt hatás kiértékelésével.

A kimenet prímása

Ez azt jelenti, hogy a kérés végén néhány szót vagy kifejezést belefogalmaz a kívánt űrlapot követő modellválasz beszerzéséhez. Például egy példa “Here’s a bulleted list of key points:\n- ” segítségével meggyőződhet arról, hogy a kimenet listajelek listájaként van formázva.

Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában. A lehető legkevesebb szóval válaszoljon. John Smith felesége Lucy Smith. Öt gyerekük van, és szoftvermérnökként dolgozik a Microsoftnál. Milyen keresési lekérdezéseket kell tennem a tényellenőrzéshez? ## Az egyik lehetséges keresési lekérdezés a következő: "John Smith feleségül vette Lucy Smith öt gyerek szoftvermérnök Microsoft"

A fenti parancssorban az "Egy lehetséges keresési lekérdezés" szöveg a következő: egyetlen kimenet létrehozásához prímozza a modellt. E nélkül a modell több keresési lekérdezést hoz létre kimenetként.

Üres szintaxis hozzáadása

Ha világos szintaxist használ a parancssorhoz – beleértve az írásjeleket, a címsorokat és a szakaszjelölőket – segít kommunikálni a szándékkal, és gyakran megkönnyíti a kimenetek elemzését.

Az alábbi példában elválasztókat (--- ebben az esetben) adnak hozzá a különböző információforrások vagy lépések között. Ez lehetővé teszi a termelés leállási --- feltételeként való használatot. Emellett a szakaszfejléceket vagy a speciális változókat nagybetűvel is meg lehet különböztetni.

Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában. Elolvas egy bekezdést, majd lekérdezéseket ad ki egy keresőmotornak annak tényellenőrzéséhez. Magyarázza el a lekérdezéseket is.
---
BEKEZDÉS
John Smith felesége Lucy Smith. Öt gyerekük van, és szoftvermérnökként dolgozik a Microsoftnál. Milyen keresési lekérdezéseket kell tennem a tényellenőrzéshez?
---
LEKÉRDEZÉSEK
1. "John Smith Microsoft" – Annak ellenőrzése, hogy John Smith valóban a Microsoftnál dolgozik-e.
2. "John Smith Lucy Smith" - Annak ellenőrzésére, hogy John Smith házas Lucy Smith.
3. "John Smith gyerekek" - Annak ellenőrzésére, hogy John Smith öt gyermek.

Ha nem biztos abban, hogy milyen szintaxist használjon, fontolja meg a Markdown vagy az XML használatát. A modelleket nagy mennyiségű webes tartalomra képezték be XML-ben és Markdownban, ami jobb eredményeket biztosíthat.

A feladat leállása

A nagy nyelvi modellek (LLM-ek) gyakran jobban teljesítenek, ha a feladat kisebb lépésekre van lebontva. A korábban hivatkozott keresési lekérdezési parancssorban például a parancssor átstrukturáltható, hogy a modell először a releváns tények kinyerésére legyen utasítva, majd arra utasítsa, hogy hozzon létre keresési lekérdezéseket, amelyek felhasználhatók a tények ellenőrzésére.

Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában. Elolvas egy bekezdést, majd lekérdezéseket ad ki egy keresőmotornak annak tényellenőrzéséhez.
---
BEKEZDÉS
John Smith felesége Lucy Smith. Öt gyerekük van, és szoftvermérnökként dolgozik a Microsoftnál. Milyen keresési lekérdezéseket kell tennem a tényellenőrzéshez?
---
Most kinyerheti a tényszerű jogcímeket, és lekérdezéseket bocsáthat ki a tényellenőrzéshez. Lekérdezés kiadásakor használja a SEARCH("query") függvényt.

TÉNYBELI ÁLLÍTÁSOK
1. John Smith felesége Lucy Smith
2. Öt gyerekük van
3. Szoftvermérnökként dolgozik a Microsoftnál

LEKÉRDEZÉSEK
SEARCH("John Smith feleségül vette Lucy Smitht")
SEARCH("John Smith család mérete")
SEARCH("John Smith Microsoft szoftvermérnök")

Figyelje meg, hogy a szakaszok megkülönböztetéséhez és a kimenet prímához használ egyértelmű szintaxist. Ebben az egyszerű példában a feladat egy-két lépésre bontása nem túl drámai, de ha ezt egy nagyobb, sok tényszerű állítással rendelkező szövegre próbálja megtenni, a feladat lebontása jelentős különbséget tehet.

A megfizethetőség használata

Néha előfordulhat, hogy a modell egy megfizethetőség használatára van képes ahelyett, hogy a saját paramétereire támaszkodnánk az információkhoz és a válaszokhoz. A keresés például megengedő megoldás lehet a kitalált válaszok enyhítésére és a naprakész információk beszerzésére.

A megfizethetőség használatának egyik egyszerű módja, ha leállítja a generációt, miután a modell létrehozta a megfizethetőség-hívásokat, majd illessze be az eredményeket a parancssorba. Az alábbiakban egy példa látható arra, hogy mi lehet az utánkövetési hívás a fenti SEARCH-hívások után. Figyelje meg, hogyan illesztettük be a keresési eredményeket a parancssorba, és hogyan cseréltük le az előző KERESÉSI hívásokat.

Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában. Elolvas egy bekezdést, kinyeri a tényszerű jogcímeket, majd a keresőmotor eredményeivel ellenőrzi őket.
---
BEKEZDÉS
John Smith felesége Lucy Smith. Öt gyerekük van, és szoftvermérnökként dolgozik a Microsoftnál. Milyen keresési lekérdezéseket kell tennem a tényellenőrzéshez?
---
TÉNYBELI ÁLLÍTÁSOK
- John Smith felesége Lucy Smith
- Johnnak és Lucynak öt gyereke van
- John szoftvermérnökként dolgozik a Microsoftnál
---
Az alábbiakban különböző keresési lekérdezéseket bocsátunk ki a fenti jogcímek kutatásához:
KERESÉSI LEKÉRDEZÉSEK
- John Smith felesége Lucy Smith
- John Smith gyermekek száma
- John Smith szoftvermérnök Microsoft
---
Íme a keresési eredmények kódrészletei:
TÖREDÉK:
[1] John Smith esküvője 2012. szeptember 25-én volt...
[2] John Smitht felesége, Lucy kísérte egy buliba
[3] Jánost két lánya és három fia kísérte el a focimeccsre.
[4] Miután 10 évet töltött a Microsoftnál, Smith megalapította saját startupját, a Tailspin Toyst
[5] John M a város smith, és feleségül vette Fiona. Van egy Lucy nevű lányuk.
---
A kódrészletek figyelembe véveével ellenőrizze a fenti ténybeli állításokat:
- John Smith felesége Lucy Smith: Megerősítette. Snippet [1] és [2] is említi John Smith felesége, mint Lucy.

- Johnnak és Lucynak öt gyereke van: megerősítve. A kódrészlet [3] megemlíti, hogy Jánost két lánya és három fia kísérte.

- John szoftvermérnökként dolgozik a Microsoftnál: részben megerősítették. A kódrészlet [4] megemlíti, hogy John 10 évet töltött a Microsoftnál, de nem kifejezetten azt mondja, hogy jelenleg ott dolgozik. További kutatásokra lehet szükség, hogy megerősítse jelenlegi foglalkoztatási állapotát.

Gondolatlánc– rákérdezés

Ez a feladat lebontási technikájának változata. Ahelyett, hogy kisebb lépésekre osztanak fel egy feladatot, ebben a megközelítésben a modell válasza arra utasítja, hogy lépésről lépésre haladjon, és mutassa be az összes részt. Ez csökkenti az eredmények pontatlanságának lehetőségét, és megkönnyíti a modell válaszának értékelését.

Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában. Ki volt a legjobban kitüntetett (maximális érmek) egyéni sportoló a Sydney-ben tartott olimpiai játékokon? A válaszban lépésről lépésre haladva hivatkozzon a forrásokra, és adjon meg érvelést, mielőtt megosztaná a végső választ az alábbi formátumban: VÁLASZ: <name> 1. lépés: Határozza meg a sydney-i olimpiai játékok évét. A Sydney-i olimpiai játékokat 2000-ben rendezték.

2. lépés: Keresse meg azoknak az egyéni sportolóknak a listáját, akik több érmet nyertek a 2000-ben sydney-i olimpián.

Szerint a hivatalos honlapján az olimpiai játékok, több egyéni sportolók, akik nyertek több érmet a 2000 Sydney Olimpia. Néhány figyelemre méltó név:
• Ian Thorpe (Ausztrália) - 3 arany, 2 ezüst, 0 bronz
• Pieter van den Hoogenband (Hollandia) - 2 arany, 0 ezüst, 2 bronz
• Lenny Krayzelburg (USA) - 3 arany, 0 ezüst, 0 bronz
• Inge de Bruijn (Hollandia) - 3 arany, 1 ezüst, 0 bronz

3. lépés: Határozza meg a legtöbb érmet tartalmazó sportolót. Miután áttekintettük az egyes sportolók listáját, akik több érmet nyertek a 2000-ben sydneyi olimpián, láthatjuk, hogy a legtöbb éremmel rendelkező sportoló az ausztráliai Ian Thorpe, aki összesen 5 érmet nyert (3 arany és 2 ezüst).

Ezért a VÁLASZ: Ian Thorpe.

A kimeneti struktúra megadása

A kimenet szerkezetének megadására vonatkozó kérés használata jelentős hatással lehet az eredmények jellegére és minőségére. Néha előfordulhat, hogy a rendszerüzenetek "csak valós tények írása" vagy "nem készítik el az információkat" típusú bemenetek nem megfelelő megoldásokat jelenthetnek. Ehelyett, ha arra kéri a modell válaszát, hogy idézeteket is tartalmazzon, segíthet csökkenteni a helytelen válaszok előfordulását.

Ha arra utasítja a modellt, hogy idézzen a forrásanyagra, amikor állításokat tesz, ezek az állítások sokkal valószínűbbek. Az idézetek lekérése miatt a modellnek minden alkalommal két hibát kell végrehajtania, amikor választ hoz létre: az első hiba a létrehozott válasz, a második pedig a rossz idézet. Vegye figyelembe, hogy minél közelebb van az idézet az általa támogatott szöveghez, annál rövidebb a modell előtt álló távolság, hogy előre jelezze az idézetet, ami arra utal, hogy a beágyazott idézetek jobb megoldásokat jelentenek a hamis tartalom előállításához, mint a tartalom végén lévő idézetek.

Hasonlóképpen, ha arra kéri a modellt, hogy kinyerje a ténybeli állításokat egy bekezdésből, az olyan összetett állításokat is kinyerhet, mint például az "X Y ÉS Z" (amelyet nehezebb ellenőrizni). Ez elkerülhető egy olyan kimeneti struktúra megadásával, mint például (entity1, relationship, entity2).

Az alábbi példák az idézetek használatát mutatják be, és a modell válaszát egy meghatározott struktúrához igazítják.

Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában Sorolja fel az ügyfélszolgálati ügynök által az alábbi beszélgetésben bemutatott különböző viselkedéseket.
---
szia köszönöm, hogy hívja contoso gyógyszertár, aki én beszélek ma értem a frusztráció mary um meg tudod mondani, hogy pontosan mit próbál elérni OK uh biztosan boldog, hogy ellenőrizze, hogy az Ön számára egy pillanatig kérem, itt látom, hogy volt egy általános formájában lipitor van, hogy a jobb OK uh így látom, hogy az orvos nem írta fel ezeket a gyógyszereket huszonegy ténylegesen OK uh Igen, én boldogan ellenőrizze, hogy az Ön számára uh, mert néha van egy rés a rendszerben, és csak nem kap jelentést, így hadd nézd meg itt csak egy pillanatra, így látom, hogy az orvos ezeket a gyógyszereket felírták Önnek huszonkéttől huszonegyig OK um igen szerint a legújabb nyilvántartások uh által biztosított orvosi hivatal most egy másik gyógyszer metformin lenne Te szereted, hogy megy előre, és töltse ki a receptet, hogy vegye fel egy kis formában ötszáz milligramm uh te nagyon szívesen Mary kérjük, tudassa velünk, ha van valami más, amit tehetünk érted ma.
---
Milyen volt az ügyfélszolgálati ügynök válasza?
Sorolja fel és sorolja fel a különböző viselkedéseket, és idézzen a besorolás mögötti okra a BEHAVIOR("reason") formátum használatával.
1. Udvarias üdvözlés VISELKEDÉS("Az ügynök udvarias üdvözléssel kezdi a beszélgetést, és kéri a hívó nevét")
2. Empatikus VISELKEDÉS("Az ügynök elismeri Mary frusztrációját, és megpróbálja megérteni az aggodalmait")
3. Figyelmes VISELKEDÉS("Az ügynök figyeli az ügyfél problémáját, és további részleteket kér")
4. Proaktív VISELKEDÉS("Az ügynök felajánlja a probléma ellenőrzését az ügyfél számára")
5. Informatív VISELKEDÉS("Az ügynök az ügyfél rendelési előzményeiről nyújt releváns információkat")
6. Alapos VISELKEDÉS("Az ügynök ellenőrzi a rendszer esetleges hiányosságait, és teljes választ ad")
7. Megerősítő VISELKEDÉS("Az ügynök megerősíti a jelenlegi gyógyszert az ügyféllel")
8. Megoldásorientált VISELKEDÉS("Az ügynök felajánlja, hogy kitölti az új receptet az ügyfél számára")
9. Udvarias VISELKEDÉS("Az ügynök köszönöm az ügyfelet, és további segítséget nyújt, ha szükséges")
Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában. Csoportosítsa a következő hírcímeket témakörkategóriákba a szövegben látható minták alapján. Említse meg a kategóriák definiálásának indokát is.
Kimeneti formátum:
{
"TOPIC_NAME": "",
"CÍMSOROK": [],
"ÉRVELÉS": ""
}

Hírcímek bevitele:
1. "A könyvektől a 10-es bemutatókig az AR + ML használatával"
2. "Demo 1993-ból 32 éves Yann LeCun mutatja ki a világ első konvolúciós hálózat szövegfelismerés"
3. "First Order Motion Model alkalmazott animálási festmények"
4. "Robinhood és más közvetítők szó szerint blokkolja vásárlása $GME, $NOK, $BB, $AMC; értékesítés engedélyezése"
5. "A United Airlines részvényei több mint 5%-os előpiacon kereskednek"
Hozam:

{
"ARTIFICIAL_INTELLIGENCE": {
"CÍMSOROK": [
"A könyvektől a 10-es bemutatókig az AR + ML használatával",
"A 32 éves Yann LeCun 1993-as bemutatója, amely a világ első konvolúciós hálózatát mutatja be a szövegfelismeréshez",
"First Order Motion Model alkalmazott animálási festmények"
],
"ÉRVELÉS": "Ezek a főcímek a mesterséges intelligenciával, a gépi tanulással és azok különböző területeken történő alkalmazásával kapcsolatosak."
},
"FINANCIAL_MARKETS": {
"CÍMSOROK": [
"Robinhood és más közvetítők szó szerint blokkolja vásárlása $GME, $NOK, $BB, $AMC; értékesítés engedélyezése",
"A United Airlines részvényei több mint 5%-os előpiacon kereskednek",
"A Bitcoin közel 20 000 dollár volt egy évvel ezelőtt ma"
],
"ÉRVELÉS": "Ezek a főcímek pénzügyi piacokhoz, részvényekhez, kriptovalutákhoz és kereskedési platformokhoz kapcsolódnak."
}
}

Hőmérséklet és Top_p paraméterek

A hőmérsékleti paraméter módosítása megváltoztatja a modell kimenetét. A hőmérsékleti paraméter 0 és 2 között állítható be. Egy magasabb érték, például a 0,7 véletlenszerűbbé teszi a kimenetet, és eltérő válaszokat eredményez, míg alacsonyabb értéket, például. 0.2, a kimenet koncentráltabbá és konkrétabbá válik. Egy fiktív történet magasabb hőmérséklet használatával hozható létre. Míg egy jogi dokumentum létrehozásához ajánlott sokkal alacsonyabb hőmérsékletet használni. Top_probability egy másik paraméter, és hasonló a Hőmérséklethez, mivel a modell válaszának véletlenszerűségét is szabályozza, de ezt más módon teszi. Az általános javaslat az, hogy a két paraméter egyikét egyszerre módosítsa, nem mindkettőt.

Földelési környezet biztosítása

A megbízható válaszok egyik leghatékonyabb módja, ha a modell adatait adja meg a válaszok lehívásához (az adatok földelése). Ha a használati eset naprakész, megbízható információkra támaszkodik, és nem csupán kreatív forgatókönyv, javasoljuk, hogy adjon meg alapadatokat. Általában minél közelebb kerül a forrásanyag a kívánt válasz végső formájához, annál kevesebb munkát kell elvégeznie a modellnek, ami azt jelenti, hogy kevesebb a hibalehetőség. Íme egy példa, amelyben a rendszer egy nemrégiben megjelent blogban ismerteti a GPT-4 elindítását az Azure OpenAI Szolgáltatásban, és kérte, hogy nevezze el néhány korai ügyfelet.

Rendszerüzenet User Segéd
Ön egy AI-asszisztens, amely segít a felhasználóknak az információk megtalálásában. A válaszokat kizárólag az alábbi szövegből fogja megadni, és legfeljebb 100 szóban válaszol:
"A Microsoftnál folyamatosan új módszereket fedezünk fel a kreativitás felszabadítására, a termelékenység felszabadítására és a készségek szintre emelésére, hogy többen kihasználhassák az AI használatát. Ez lehetővé teszi ügyfeleink számára, hogy ...

… ezáltal csökken annak a valószínűsége, hogy a modell káros választ ad."1

Válasz legfeljebb 100 szóban. Használjon listajeles listákat, ahol csak lehetséges.
Kik az Azure OpenAI Service GPT-4 modellek korai ügyfelei? Az Azure OpenAI Service GPT-4 modelljeinek néhány korai ügyfele:
- Epic Healthcare: Azt tervezik, hogy a GPT-4 segítségével orvosok és nővérek kevesebb időt töltenek adatbevitel és vizsgálat.
- Coursera: Az Azure OpenAI szolgáltatást a GPT-4 használatával használják, hogy új AI-alapú tanulási élményt hozzanak létre a platformjukon.
- Coca-Cola: Az Azure OpenAI használatával fejlesztenek egy tudásközpontot, és a GPT-4 multimodális képességeinek kihasználását tervezik marketing, reklám, public relations és ügyfélkapcsolatok terén.
– Más, különböző méretű vállalatok az Azure AI használatával fejlesztik az ügyfélélményt, összegzik a hosszú formátumú tartalmakat, segítenek szoftvereket írni, és a megfelelő adózási adatok előrejelzésével csökkentik a kockázatokat.

1 Az Azure OpenAI GPT-4 indítási blogjának szövege.

Ajánlott eljárások

  • Legyen konkrét. Lehetőleg kerülje a kétértelműséget. Határolja körül a témakört.
  • Legyen leíró. Használjon analógiákat.
  • Dupla lefelé. Előfordulhat, hogy ismételnie kell magát a modellben. Adja meg az utasításokat az elsődleges tartalom előtt és az után is, használjon utasítást és egy célzást stb.
  • A rendelés számít. A modell információinak beadási sorrendje hatással lehet a kimenetre. A kimenetben különbséget tehet, ha útmutatást ad a tartalom elé ("összegzi a következőket...") vagy utána ("összegzi a fentieket..."). Már néhány példa sorrendje is számíthat. Ez az új információk előnyben részesítéseként ismert jelenség.
  • Adjon egy "out" értéket a modellnek. Néha hasznos lehet alternatív útvonalat adni a modellnek, ha nem tudja elvégezni a hozzárendelt feladatot. Ha például kérdést tesz fel egy szövegrészen, például a "nem található" válaszsal válaszolhat, ha a válasz nem jelenik meg. Ez segíthet a modellnek elkerülni a hamis válaszok generálását.

Területhatékonyság

Bár a bemenet mérete a GPT-modellek minden új generációjában nagyobb, továbbra is előfordulhat, hogy a megadott adatmennyiség nagyobb a modell által kezelhetőnél. A GPT-modellek "jogkivonatokra" bontják a szavakat. Míg a gyakori több szótagos szavak gyakran egyetlen jogkivonatok, a kevésbé gyakori szavak szótagokban vannak törve. A jogkivonatok néha ellentétesek lehetnek, ahogy az alábbi példában látható, amely a különböző dátumformátumok jogkivonat-határait mutatja be. Ebben az esetben a teljes hónap helyesírása hatékonyabb, mint egy teljes numerikus dátum. A jelenlegi jogkivonat-támogatás a korábbi GPT-3 modellekkel rendelkező 2000 tokentől akár 32 768 jogkivonatig terjed a legújabb GPT-4 modell 32k-s verziójával.

Képernyőkép egy szöveges sztringről, kiemelt színekkel, a jogkivonat határait elválasztó vonallal.

Mivel ez a korlátozott terület, fontos, hogy a lehető leghatékonyabban használják.

  • Táblázatok – Ahogyan az előző szakaszban bemutatott példákban is látható, a GPT-modellek elég könnyen megérthetik a táblázatos formázott adatokat. Ez a hely hatékony módja lehet az adatok befoglalásának, nem pedig az összes névvel ellátott mező (például JSON) elé.
  • Térköz – Az egymást követő térközök különálló jogkivonatokként vannak kezelve, amelyek könnyen elpazarlhatják a helyet. A szó előtti szóközöket viszont általában a szóéval megegyező jogkivonat részeként kezelik. Gondosan figyelje meg a térköz használatát, és ne használjon írásjelet, ha csak egy szóközt használ.