Використовуйте модель із підтримкою Vision у порталі Microsoft Foundry

3 хв.

Порада

Перегляньте вкладку Текст і зображення для отримання більш детальної інформації!

Щоб обробляти підказки, які містять зображення, потрібно розгорнути модель генеративного ші з кількома моделятивами , іншими словами, модель, яка підтримує не тільки введення на основі тексту, але й на основі зображень (а в деяких випадках і аудіо- та введення). Мультимодальні моделі, доступні в Microsoft Foundry, включають (серед інших):

Microsoft Phi-4-мультимодально-інструкт
OpenAI gpt-4.1
OpenAI gpt-4.1-mini

Порада

Щоб дізнатися більше про доступні моделі в Microsoft Foundry, дивіться оглядову статтю Microsoft Foundry Models у документації Microsoft Foundry.

Тестування мультимодальних моделей із підказками на основі зображень

Після розгортання мультимодальної моделі ви можете протестувати її в чат-майданчику порталу Microsoft Foundry.

Знімок екрана: ігровий майданчик чату з підказкою на основі зображень.

На ігровому майданчику чату можна передати зображення з локального файлу та додати текст до повідомлення, щоб викликати відповідь від багатомодальної моделі.

Зворотний зв’язок

Чи була ця сторінка корисна?