Utiliser un modèle doté de capacités de vision dans le portail Microsoft Foundry
Conseil / Astuce
Pour plus d’informations, consultez l’onglet Texte et images !
Pour gérer les invites qui incluent des images, vous devez déployer un modèle d’intelligence artificielle multimodale, en d’autres termes, un modèle qui prend en charge non seulement l’entrée basée sur du texte, mais également l’entrée basée sur des images (et dans certains cas, l’entrée audio aussi). Les modèles modals disponibles dans Microsoft Foundry incluent (entre autres) :
- Microsoft Phi-4-multimodal-instruct
- OpenAI gpt-4.1
- OpenAI gpt-4.1-mini
Conseil / Astuce
Pour en savoir plus sur les modèles disponibles dans Microsoft Foundry, consultez l’article de vue d’ensemble des modèles Foundry Microsoft dans la documentation Microsoft Foundry.
Test de modèles multimodaux avec des incitations basées sur des images
Après avoir déployé un modèle modal, vous pouvez le tester dans le terrain de jeu de conversation dans le portail Microsoft Foundry.
Dans le terrain de jeu de conversation, vous pouvez charger une image à partir d’un fichier local et ajouter du texte au message pour déclencher une réponse à partir d’un modèle modal.