在 Microsoft Foundry 入口網站中使用具備視覺功能的模型
小提示
有關更多詳細信息,請參閱 文本和圖像 選項卡!
若要處理包含影像的提示,您必須部署 多模 式產生 AI 模型,換句話說,此模型不僅支援以文字為基礎的輸入,而且支援以影像為基礎的(在某些情況下,以音訊為基礎的)輸入。 Microsoft Foundry 提供的多模態模型包括(除其他外):
- Microsoft Phi-4-multimodal-instruct
- OpenAI gpt-4.1
- OpenAI gpt-4.1-mini
小提示
欲了解更多 Microsoft Foundry 可用模型,請參閱 Microsoft Foundry 文件中的 Microsoft Foundry 模型概覽 文章。
使用以影像為基礎的提示測試多模式模型
部署多模態模型後,你可以在 Microsoft Foundry 入口網站的聊天室進行測試。
在聊天遊樂場中,您可以從本機檔案上傳影像,並將文字新增至訊息,以從多模式模型產生回應。