你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
快速入门:在 AI Studio 聊天操场中收听聊天模型的语音并与之交谈
通过将 Azure OpenAI 服务与 Azure AI 语音配对,让应用能够收听和讲话,从而实现更丰富的交互。
在本快速入门中,你将使用 Azure OpenAI 服务和 Azure AI 语音来实现以下目的:
- 通过语音转文本来与助手交谈。
- 通过文本转语音收听助手的回复。
语音转文本功能和文本转语音功能可以在 AI Studio 聊天操场中一起使用,也可以单独使用。 可以在部署聊天模型之前使用操场来测试该模型。
先决条件
- Azure 订阅 - 免费创建订阅。
- 一个 AI Studio 项目。
- 已部署的 Azure OpenAI 聊天模型。 本指南使用
gpt-4
模型进行测试。
配置聊天操场
在启动聊天会话之前,需要将聊天操场配置为使用语音转文本功能和文本转语音功能。
登录到 Azure AI Studio。
转到你的项目或在 Azure AI Studio 中创建新项目。
从操场列表中选择“聊天”。
从“部署”下拉列表中选择部署的聊天模型。
选择“聊天功能”按钮。
注意
你还应会看到用于选择麦克风或扬声器按钮的选项。 如果选择上述任一按钮,但尚未启用语音转文本功能或文本转语音功能,系统会提示你在“聊天功能”中启用它们。
在“聊天功能”页上,选择用于确认使用语音功能会产生额外费用的框。 有关详细信息,请参阅 Azure AI 语音定价。
选择“启用语音转文本”和“启用文本转语音”。
选择你想要用于讲话和收听的语言区域设置和语音。 可用语音的列表取决于你选择的区域设置。
或者,可以在返回到聊天会话之前试用语音。 输入一些示例文本,然后选择“播放”以
选择“保存”。
启动聊天会话
在此聊天会话中,你将同时使用语音转文本和文本转语音。 你将使用语音转文本功能来与助手交谈,并使用文本转语音功能来收听助手的回复。
如果你尚未完成配置操场部分中的步骤,现在请完成。 若要完成本快速入门,需要启用语音转文本和文本转语音功能。
选择麦克风按钮并与助手交谈。 例如,可以说出“你是否知道在何处可以购买 Xbox”。
选择“发送”按钮(右箭头)将消息发送给助手。 助手的回复将显示在聊天会话窗格中。
注意
如果扬声器按钮已打开,你将听到助手的回复。 如果扬声器按钮已关闭,你将听不到助手的回复,但回复仍会显示在聊天会话窗格中。
可以更改系统提示来更改助手的回复格式或风格。
例如,输入:
"You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
回复显示在聊天会话窗格中。 由于扬声器按钮已打开,因此你还可以听到回复。
查看示例代码
可以选择“查看代码”按钮来查看和复制示例代码,其中包括 Azure OpenAI 和语音服务的配置。
可以使用示例代码在应用程序中启用语音转文本和文本转语音。
提示
有关其他示例,请参阅语音到语音聊天代码示例。
清理资源
为了避免产生不必要的 Azure 成本,如果不再需要在本快速入门中创建的资源,应该将其删除。 若要管理资源,可以使用 Azure 门户。