介绍

已完成

借助 AI 语音功能,我们可以通过语音指令管理家庭和汽车系统、从计算机获取口述问题的解答、从音频生成字幕等等。

为了实现这种交互,AI 系统必须支持两种能力:

  • 语音识别 - 检测和解释语音输入的能力
  • 语音合成 - 生成语音输出的能力

Azure AI 语音通过语音识别及合成提供语音转文本和文本转语音功能。 可以使用预生成的自定义语音服务模型完成各种任务,包括高度准确地将音频转录为文本、识别对话中的说话人、创建自定义语音等。 接下来了解 AI 语音功能的工作原理。