部署多模式模型

已完成

若要處理包含音訊的提示,您必須部署 多模式 產生 AI 模型,換句話說,這是支援文字型輸入,而且支援音訊型輸入的模型。 Microsoft Foundry 提供的多模態模型包括(除其他外):

  • Microsoft Phi-4-multimodal-instruct
  • OpenAI gpt-4o
  • OpenAI gpt-4o-mini

小提示

欲了解更多於 Microsoft Foundry 中可用的模型,請參閱 Microsoft Foundry 文件中的文章「Microsoft Foundry 入口網站的模型目錄和集合」。

使用音訊型提示測試多模式模型

部署多模態模型後,你可以在 Microsoft Foundry 入口網站的聊天室進行測試。 某些模型可讓您藉由上傳檔案或錄製訊息,在遊樂場中包含音訊附件。

聊天遊樂場的螢幕快照,其中包含音訊型提示。

在聊天遊樂場中,您可以上傳本機音訊檔案,並將文字新增至訊息,以從多模式模型產生回應。