Share via


Mikor érdemes az Azure OpenAI finomhangolását használni?

Amikor eldönti, hogy a finomhangolás a megfelelő megoldás-e egy adott használati eset feltárásához, van néhány fontos kifejezés, amelyet érdemes ismernie:

  • A Prompt Engineering egy olyan technika, amely magában foglalja a természetes nyelvi feldolgozási modellekre vonatkozó kérések tervezését. Ez a folyamat javítja a válaszok pontosságát és relevanciáját, optimalizálva a modell teljesítményét.
  • A kiterjesztett generáció (RAG) beolvasása javítja a nagy nyelvi modell (LLM) teljesítményét azáltal, hogy adatokat kér le külső forrásokból, és beépíti őket egy parancssorba. A RAG lehetővé teszi a vállalatok számára, hogy testre szabott megoldásokat érjenek el az adatok relevanciájának fenntartása és a költségek optimalizálása mellett.
  • A finomhangolás példaadatok használatával újratanít egy meglévő nagy nyelvi modellt, ami egy új "egyéni" nagy nyelvi modellt eredményez, amelyet a megadott példák alapján optimalizáltak.

Mi az Azure OpenAI finomhangolása?

Amikor finomhangolásról beszélünk, valójában a felügyelt finomhangolást értjük, nem pedig a folyamatos előtanítást vagy a megerősítési Tanulás emberi visszajelzésen (RLHF) keresztül. A felügyelt finomhangolás az előre betanított modellek adott adathalmazokon történő újratanításának folyamatát jelenti, jellemzően az adott feladatok modellteljesítményének javítása vagy olyan információk bevezetése érdekében, amelyek az alapmodell eredeti betanításakor nem jelentek meg megfelelően.

A finomhangolás egy fejlett technika, amely szakértelemre van szükség a megfelelő használathoz. Az alábbi kérdések segítenek felmérni, hogy készen áll-e a finomhangolásra, és hogy milyen jól átgondolta a folyamatot. Ezekkel végigvezetheti a következő lépéseket, vagy azonosíthat más, esetleg megfelelőbb megközelítéseket.

Miért szeretne finomhangolni egy modellt?

  • Képesnek kell lennie arra, hogy világosan megfogalmazzon egy konkrét használati esetet a finomhangoláshoz, és azonosítsa a finomhangolandó modellt .
  • A finomhangoláshoz jól használható esetek közé tartozik a modell irányítása a tartalom adott és testre szabott stílusban, hangnemben vagy formátumban való kimenetére, vagy olyan helyzetekben, ahol a modell irányításához szükséges információk túl hosszúak vagy összetettek ahhoz, hogy elférjenek a parancssori ablakban.

Előfordulhat, hogy még nem áll készen a finomhangolásra:

  • Nincs egyértelmű használati eset a finomhangoláshoz, vagy nem lehet sokkal többet megfogalmazni, mint a "Jobb modellt szeretnék létrehozni".
  • Ha elsődleges motiválóként azonosítja a költségeket, körültekintően járjon el. A finomhangolás csökkentheti bizonyos használati esetek költségeit a kérések lerövidítésével vagy egy kisebb modell használatának engedélyezésével, de a betanítás magasabb kezdeti költséggel jár, és saját egyéni modell üzemeltetéséért kell fizetnie. Az Azure OpenAI finomhangolási költségeiről további információt a díjszabási oldalon talál .
  • Ha tartományon kívüli ismereteket szeretne hozzáadni a modellhez, először a kiterjesztett generáció (RAG) lekérésével kell kezdenie olyan funkciókkal, mint az Azure OpenAI-k az adatokon vagy a beágyazásokon. Ez gyakran olcsóbb, adaptálhatóbb és potenciálisan hatékonyabb megoldás a használati esettől és az adatoktól függően.

Mit próbáltál eddig?

A finomhangolás speciális képesség, nem pedig a generatív AI-folyamat kiindulópontja. Már ismernie kell a nagy nyelvi modellek (LLM-ek) használatának alapjait. Első lépésként az alapmodell teljesítményének gyors tervezéssel és/vagy lekéréses kiterjesztett generációval (RAG) kell kiértékelnie a teljesítmény alapkonfigurációját.

A finomhangolás nélküli teljesítmény alapkonfigurációja elengedhetetlen ahhoz, hogy megtudjuk, a finomhangolás javította-e a modell teljesítményét. A rossz adatokkal való finomhangolás rontja az alapmodellt, de alapkonfiguráció nélkül nehéz észlelni a regressziókat.

Ha készen áll a finomhangolásra:

  • Képesnek kell lennie bizonyítani a Prompt Engineering és a RAG-alapú megközelítések bizonyítékait és ismereteit.
  • A használati esethez már kipróbált finomhangoláson kívül más technikákkal is megoszthat konkrét tapasztalatokat és kihívásokat.
  • Lehetőség szerint mennyiségi értékeléssel kell rendelkeznie az alapteljesítményről.

Előfordulhat, hogy még nem áll készen a finomhangolásra:

  • Kezdve a finomhangolással anélkül, hogy bármilyen más technikát tesztelt volna.
  • Nem megfelelő ismeretek vagy ismeretek arról, hogy a finomhangolás hogyan vonatkozik kifejezetten a nagy nyelvi modellekre (LLM-ekre).
  • Nincs viszonyítási alapmérés a finomhangolás értékeléséhez.

Mi nem működik alternatív megközelítésekkel?

Annak megértése, hogy a gyors tervezés hol rövid, útmutatást kell nyújtania a finomhangoláshoz. Az alapmodell nem működik peremes esetekben vagy kivételeknél? Az alapmodell nem konzisztensen adja meg a kimenetet a megfelelő formátumban, és nem fér el elegendő példa a környezeti ablakban a javításhoz?

Az alapmodell meghibásodására és a gyors tervezésre vonatkozó példák segítenek azonosítani azokat az adatokat, amelyeket a finomhangoláshoz gyűjteniük kell, és hogy hogyan kell kiértékelni a finomhangolt modellt.

Íme egy példa: Egy ügyfél a GPT-3.5-Turbo használatával akart természetes nyelvi kérdéseket lekérdezésekké alakítani egy adott, nem szabványos lekérdezési nyelven. Útmutatást adtak a parancssorban ("Mindig adja vissza a GQL-t"), és a RAG használatával kérték le az adatbázissémát. A szintaxis azonban nem mindig helyes, és gyakran meghiúsult a peremes esetek esetében. Több ezer példát gyűjtöttek a természetes nyelvi kérdésekre és az adatbázisuk egyenértékű lekérdezéseire, beleértve azokat az eseteket is, amikor a modell korábban sikertelen volt – és ezeket az adatokat használták fel a modell finomhangolásához. Az új, finomhangolt modell és a megtervezett kérés és lekérés kombinálásával a modell kimeneteinek pontossága elfogadható szabványoknak felelt meg a használathoz.

Ha készen áll a finomhangolásra:

  • Világos példákat mutatunk be arra, hogyan közelítette meg a kihívásokat alternatív megközelítésekben, és hogy mi lett tesztelve a lehetséges megoldásként a teljesítmény javítása érdekében.
  • Hiányosságokat észlelt egy alapmodell használatával, például a peremhálózati esetek inkonzisztens teljesítményével, a környezeti ablakban elég kevés lövési kérés elférése a modell irányításához, nagy késés stb.

Előfordulhat, hogy még nem áll készen a finomhangolásra:

  • A modellből vagy adatforrásból nem áll rendelkezésre elegendő tudás.
  • Nem találja a modell kiszolgálásához megfelelő adatokat.

Milyen adatokat fog használni a finomhangoláshoz?

A finomhangolás még nagyszerű használati eset esetén is csak olyan jó, mint a rendelkezésre álló adatok minősége. Hajlandónak kell lennie arra, hogy időt és energiát fektetjen a finomhangolási munka elvégzésére. A különböző modellek eltérő adatmennyiségeket igényelnek, de gyakran elég nagy mennyiségű kiváló minőségű, válogatott adatot kell biztosítani.

Egy másik fontos pont még a kiváló minőségű adatok esetében is, ha az adatok nem a megfelelő formátumban, a finomhangoláshoz szükséges formátumban lesznek véglegesítve mérnöki erőforrások az adatok megfelelő formázásához.

Adat Babbage-002 & Davinci-002 GPT-3.5-Turbo
Volume Több ezer példa Több ezer példa
Format Kérés/befejezés Beszélgetési csevegés

Ha készen áll a finomhangolásra:

  • Azonosított egy adatkészletet a finomhangoláshoz.
  • Az adathalmaz a betanításhoz megfelelő formátumban van.
  • Az adathalmazok minőségének biztosítása érdekében bizonyos szintű gondnokság van alkalmazva.

Előfordulhat, hogy még nem áll készen a finomhangolásra:

  • Az adathalmazt még nem azonosították.
  • Az adathalmaz formátuma nem egyezik a finomhangolni kívánt modellel.

Hogyan méri a finomhangolt modell minőségét?

Erre a kérdésre nincs egyetlen helyes válasz, de egyértelműen meghatározott célokkal kell rendelkeznie ahhoz, hogy a finomhangolás sikeres legyen. Ideális esetben ennek nem csak minőséginek kell lennie, hanem olyan mennyiségi sikerességi mértékeket is tartalmaznia kell, mint például egy visszatartott adatkészlet használata az ellenőrzéshez, valamint a felhasználói elfogadási tesztelés vagy a finomhangolt modell alapmodellen való tesztelése.

További lépések