你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
快速入门:在 Azure AI Foundry 门户聊天操场中收听聊天模型的语音并与之交谈
在 Azure AI Foundry 门户的聊天操场中,可以使用语音转文本和文本转语音功能与聊天模型交互。 可以在基于语音的聊天中尝试用于基于文本的聊天的同一模型。 这只是与模型交互的另一种方法。
在本快速入门中,你将使用 Azure OpenAI 服务和 Azure AI 语音来实现以下目的:
- 通过语音转文本来与助手交谈。
- 通过文本转语音收听助手的回复。
语音转文本功能和文本转语音功能可以在 Azure AI Foundry 门户聊天操场中一起使用,也可以单独使用。 可以在部署聊天模型之前使用操场来测试该模型。
先决条件
- Azure 订阅 - 免费创建订阅。
- 一个 Azure AI Foundry 项目。
- 已部署的 Azure OpenAI 聊天模型。 本指南使用
gpt-4o-mini
模型进行测试。
配置聊天操场
在启动聊天会话之前,需要将聊天操场配置为使用语音转文本功能和文本转语音功能。
登录到 Azure AI Foundry。
转到 Azure AI Foundry 项目。 如果需要创建项目,请参阅创建 Azure AI Foundry 项目。
从左窗格中选择“操场”,然后选择要使用的操场。 在此示例中,选择“试用聊天操场”。
从“部署”下拉列表中选择部署的聊天模型。
选择“聊天功能”按钮。
注意
你还应会看到用于选择麦克风或扬声器按钮的选项。 如果选择上述任一按钮,但尚未启用语音转文本功能或文本转语音功能,系统会提示你在“聊天功能”中启用它们。
在“聊天功能”页上,选择用于确认使用语音功能会产生额外费用的框。 有关详细信息,请参阅 Azure AI 语音定价。
选择“启用语音转文本”和“启用文本转语音”。
选择你想要用于讲话和收听的语言区域设置和语音。 可用语音的列表取决于你选择的区域设置。
或者,可以在返回到聊天会话之前试用语音。 输入一些示例文本,然后选择“播放”以
选择“保存”。
启动聊天会话
在此聊天会话中,你将同时使用语音转文本和文本转语音。 你将使用语音转文本功能来与助手交谈,并使用文本转语音功能来收听助手的回复。
如果你尚未完成配置操场部分中的步骤,现在请完成。 若要完成本快速入门,需要启用语音转文本和文本转语音功能。
选择麦克风按钮并与助手交谈。 例如,可以说出“你是否知道在何处可以购买 Xbox”。
选择“发送”按钮(右箭头)将消息发送给助手。 助手的回复将显示在聊天会话窗格中。
注意
如果扬声器按钮已打开,你将听到助手的回复。 如果扬声器按钮已关闭,你将听不到助手的回复,但回复仍会显示在聊天会话窗格中。
可以更改系统提示来更改助手的回复格式或风格。
例如,输入:
"You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
再次说:“你知道哪里可以买到 Xbox 吗”。 回复显示在聊天会话窗格中。 由于扬声器按钮已打开,因此你还可以听到回复。
清理资源
为了避免产生不必要的 Azure 成本,如果不再需要在本快速入门中创建的资源,应该将其删除。 若要管理资源,可以使用 Azure 门户。