Látásra képes modell használata a Microsoft Foundry portálon
Jótanács
További részletekért tekintse meg a Szöveg és képek lapot!
A képeket tartalmazó kérések kezeléséhez többmodális generatív AI-modellt kell üzembe helyeznie, vagyis egy olyan modellt, amely nem csak a szövegalapú bemenetet, hanem a képalapú (és bizonyos esetekben hangalapú) bemenetet is támogatja. A Microsoft Foundryben elérhető multimodális modellek többek között a következők:
- Microsoft Phi-4-multimodális utasítás
- OpenAI gpt-4.1
- OpenAI gpt-4.1-mini
Jótanács
A Microsoft Foundryben elérhető modellekről a Microsoft Foundry dokumentációjának Microsoft Foundry-dokumentációjában található áttekintési cikkben talál további információt.
Többmodális modellek tesztelése képalapú kérésekkel
A multimodális modell üzembe helyezése után tesztelheti a Microsoft Foundry portál csevegőterében.
A csevegési játszótéren feltölthet egy képet egy helyi fájlból, és szöveget adhat hozzá az üzenethez, hogy választ küldjön egy többmodális modellből.