介绍
Azure 语音在 Foundry 工具中提供语音转文本与文本转语音功能,可集成到 AI 应用程序中。 这些功能使你可以将音频转录为文本,并从文本合成自然语音。
虽然可以直接通过语音 SDK 或 REST API 调用这些功能,但也可以通过 Azure 语音模型上下文协议 (MCP) 服务器将其提供给 AI 代理。 此方法允许代理基于用户的自然语言请求处理语音任务,而无需为每个语音操作编写特定代码。
例如,假设你为需要处理客户支持呼叫的公司工作。 你的团队需要将录制的呼叫转录为文本进行分析,并生成可以播放给客户的音频响应。 可以创建使用 Azure 语音 MCP 服务器通过单个工具连接执行这两项任务的 AI 代理,而不是为听录和合成生成单独的集成。
在本模块中,你将了解 Azure 语音 MCP 服务器的工作原理、如何在 Microsoft Foundry 中将其连接到 AI 代理,以及如何构建以编程方式与代理交互的客户端应用程序。
注释
Azure 语音 MCP 服务器目前以公共预览版提供。 本模块中所述的详细信息可能会更改。