Melyik modellt kell használni
A használni kívánt LLM kiválasztásakor számos tényezőt figyelembe kell venni, például a költségeket, a rendelkezésre állást, a teljesítményt és a képességet. Általában a következő útmutatókat javasoljuk:
gpt-35-turbo: Ez a modell gazdaságos, jól teljesít, és a ChatGPT-név ellenére a csevegésen és beszélgetésen túl számos feladathoz használható.
gpt-35-turbo-16k, gpt-4 vagy gpt-4-32k: Ezek a modellek jó választás, ha több mint 4096 tokent kell létrehoznia, vagy nagyobb kéréseket kell támogatnia. Ezek a modellek azonban drágábbak, lassabbak lehetnek, és korlátozott rendelkezésre állásuk lehet.
Beágyazási modellek: Ha a feladatok közé tartozik a keresés, a fürtözés, a javaslatok és az anomáliadetektálás, akkor beágyazási modellt kell használnia. A számítógépek egyszerűen használhatják a beágyazást alkotó számok vektorát. A beágyazás egy szöveg szemantikai jelentésének információdús ábrázolása. A két beágyazás közötti távolság a vektortérben korrelál a szemantikai hasonlósággal. Ha például két szöveg hasonló, akkor a vektoros ábrázolásuk is hasonló.
DALL-E: Ez a modell képeket hoz létre szöveges kérésekből. A DALL-E különbözik a többi nyelvi modelltől, mert a kimenete kép, nem szöveg.
Suttogás: Ez a modell egy nagy méretű, angol nyelvű hang- és szövegkészleten van betanítve. A Whisper olyan beszédfelismerési képességekre van optimalizálva, mint a hangfájlok átírása. Olyan hangfájlok átírására használható, amelyek nem angol nyelven, hanem más nyelveken tartalmaznak beszédet, de a modell kimenete angol szöveg. A Whisper használatával gyorsan átírhatja a hangfájlokat egyenként, lefordíthatja a hangokat más nyelvekről angolra, vagy a modellnek a kimenet irányítására kérheti.