在 Microsoft Foundry 入口網站中使用具備視覺功能的模型

已完成

小提示

有關更多詳細信息,請參閱 文本和圖像 選項卡!

若要處理包含影像的提示,您必須部署 多模 式產生 AI 模型,換句話說,此模型不僅支援以文字為基礎的輸入,而且支援以影像為基礎的(在某些情況下,以音訊為基礎的)輸入。 Microsoft Foundry 提供的多模態模型包括(除其他外):

  • Microsoft Phi-4-multimodal-instruct
  • OpenAI gpt-4.1
  • OpenAI gpt-4.1-mini

小提示

欲了解更多 Microsoft Foundry 可用模型,請參閱 Microsoft Foundry 文件中的 Microsoft Foundry 模型概覽 文章。

使用以影像為基礎的提示測試多模式模型

部署多模態模型後,你可以在 Microsoft Foundry 入口網站的聊天室進行測試。

聊天遊樂場的螢幕快照,其中包含影像型提示。

在聊天遊樂場中,您可以從本機檔案上傳影像,並將文字新增至訊息,以從多模式模型產生回應。