Використовуйте модель із підтримкою Vision у порталі Microsoft Foundry
Порада
Перегляньте вкладку Текст і зображення для отримання більш детальної інформації!
Щоб обробляти підказки, які містять зображення, потрібно розгорнути модель генеративного ші з кількома моделятивами , іншими словами, модель, яка підтримує не тільки введення на основі тексту, але й на основі зображень (а в деяких випадках і аудіо- та введення). Мультимодальні моделі, доступні в Microsoft Foundry, включають (серед інших):
- Microsoft Phi-4-мультимодально-інструкт
- OpenAI gpt-4.1
- OpenAI gpt-4.1-mini
Порада
Щоб дізнатися більше про доступні моделі в Microsoft Foundry, дивіться оглядову статтю Microsoft Foundry Models у документації Microsoft Foundry.
Тестування мультимодальних моделей із підказками на основі зображень
Після розгортання мультимодальної моделі ви можете протестувати її в чат-майданчику порталу Microsoft Foundry.
На ігровому майданчику чату можна передати зображення з локального файлу та додати текст до повідомлення, щоб викликати відповідь від багатомодальної моделі.