總結
在本課程模組中,您已瞭解已啟用音訊的產生 AI 模型,以及如何實作包含音訊型輸入的聊天解決方案。
啟用音訊的模型可讓您建立 AI 解決方案,以瞭解音訊並回應相關問題或指示。 除了只識別口語之外,有些模型還可以根據他們聽到的內容來使用推理。 例如,他們可以摘要訊息或評估說話者的情感。
小提示
欲了解更多關於在 Microsoft Foundry 中使用多模態模型的資訊,請參閱 《如何在聊天完成中運用影像與音訊搭配 Azure AI 模型推論 》及 《快速入門:在你的 AI 聊天中使用語音與音訊》。