Összefoglalás

1 perc

Jótanács

További részletekért tekintse meg a Szöveg és képek lapot!

Ebben a modulban megismerkedett a látásalapú, generatív AI-modellekkel, valamint a képalapú bemenetet tartalmazó csevegőmegoldások implementálásának módjával.

A vision-kompatibilis modellek lehetővé teszik olyan AI-megoldások létrehozását, amelyek képesek megérteni a képeket, és válaszolni a kapcsolódó kérdésekre vagy utasításokra. A képeken lévő objektumok azonosításán túl egyes modellek az általuk látottak alapján is használhatnak érvelést. Értelmezhetnek például egy diagramot, vagy felmérhetik, hogy sérült-e egy objektum.

Jótanács

A képek OpenAI Responses API-val való elemzésével kapcsolatos további információkért lásd: Képek és látásmód az OpenAI fejlesztői útmutatójában.

Visszajelzés

Hasznosnak találta ezt az oldalt?