Utiliser un modèle doté de capacités de vision dans le portail Microsoft Foundry

3 minutes

Conseil / Astuce

Pour plus d’informations, consultez l’onglet Texte et images !

Pour gérer les invites qui incluent des images, vous devez déployer un modèle d’intelligence artificielle multimodale, en d’autres termes, un modèle qui prend en charge non seulement l’entrée basée sur du texte, mais également l’entrée basée sur des images (et dans certains cas, l’entrée audio aussi). Les modèles modals disponibles dans Microsoft Foundry incluent (entre autres) :

Microsoft Phi-4-multimodal-instruct
OpenAI gpt-4.1
OpenAI gpt-4.1-mini

Conseil / Astuce

Pour en savoir plus sur les modèles disponibles dans Microsoft Foundry, consultez l’article de vue d’ensemble des modèles Foundry Microsoft dans la documentation Microsoft Foundry.

Test de modèles multimodaux avec des incitations basées sur des images

Après avoir déployé un modèle modal, vous pouvez le tester dans le terrain de jeu de conversation dans le portail Microsoft Foundry.

Capture d’écran du terrain de jeu de conversation avec une invite basée sur l’image.

Dans le terrain de jeu de conversation, vous pouvez charger une image à partir d’un fichier local et ajouter du texte au message pour déclencher une réponse à partir d’un modèle modal.

Commentaires

Cette page a-t-elle été utile ?