在 Microsoft Foundry 门户中使用支持视觉的模型

已完成

若要处理包含图像的提示,需要部署 多模式 生成 AI 模型-换句话说,该模型不仅支持基于文本的输入,而且还支持基于图像(在某些情况下,基于音频)输入。 Microsoft Foundry 中提供的多模式模型包括(等等):

  • Microsoft Phi-4-multimodal-instruct
  • OpenAI gpt-4.1
  • OpenAI gpt-4.1-mini

小窍门

若要详细了解 Microsoft Foundry 中的可用模型,请参阅 Microsoft Foundry 文档中的 Microsoft Foundry 模型概述 文章。

使用基于图像的提示测试多模式模型

部署多模式模型后,可以在 Microsoft Foundry 门户的聊天场中对其进行测试。

聊天场的屏幕截图,其中显示了基于图像的提示。

在聊天场中,可以从本地文件上传图像,并将文本添加到消息中,以从多模式模型获取响应。