Összefoglalás
Jótanács
További részletekért tekintse meg a Szöveg és képek lapot!
Ebben a modulban megismerkedett a látásalapú, generatív AI-modellekkel, valamint a képalapú bemenetet tartalmazó csevegőmegoldások implementálásának módjával.
A vision-kompatibilis modellek lehetővé teszik olyan AI-megoldások létrehozását, amelyek képesek megérteni a képeket, és válaszolni a kapcsolódó kérdésekre vagy utasításokra. A képeken lévő objektumok azonosításán túl egyes modellek az általuk látottak alapján is használhatnak érvelést. Értelmezhetnek például egy diagramot, vagy felmérhetik, hogy sérült-e egy objektum.
Jótanács
A képek OpenAI Responses API-val való elemzésével kapcsolatos további információkért lásd: Képek és látásmód az OpenAI fejlesztői útmutatójában.