Látásra képes modell használata a Microsoft Foundry portálon

3 perc

Jótanács

További részletekért tekintse meg a Szöveg és képek lapot!

A képeket tartalmazó kérések kezeléséhez többmodális generatív AI-modellt kell üzembe helyeznie, vagyis egy olyan modellt, amely nem csak a szövegalapú bemenetet, hanem a képalapú (és bizonyos esetekben hangalapú) bemenetet is támogatja. A Microsoft Foundryben elérhető multimodális modellek többek között a következők:

Microsoft Phi-4-multimodális utasítás
OpenAI gpt-4.1
OpenAI gpt-4.1-mini

Jótanács

A Microsoft Foundryben elérhető modellekről a Microsoft Foundry dokumentációjának Microsoft Foundry-dokumentációjában található áttekintési cikkben talál további információt.

Többmodális modellek tesztelése képalapú kérésekkel

A multimodális modell üzembe helyezése után tesztelheti a Microsoft Foundry portál csevegőterében.

Képernyőkép a csevegési játszótérről egy képalapú üzenettel.

A csevegési játszótéren feltölthet egy képet egy helyi fájlból, és szöveget adhat hozzá az üzenethez, hogy választ küldjön egy többmodális modellből.

Visszajelzés

Hasznosnak találta ezt az oldalt?