你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

快速入门:在 AI Studio 聊天操场中收听聊天模型的语音并与之交谈

重要

本文介绍的某些功能可能仅在预览版中提供。 此预览版未提供服务级别协议,不建议将其用于生产工作负载。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款

通过将 Azure OpenAI 服务与 Azure AI 语音配对,让应用能够收听和讲话,从而实现更丰富的交互。

在本快速入门中,你将使用 Azure OpenAI 服务和 Azure AI 语音来实现以下目的:

  • 通过语音转文本来与助手交谈。
  • 通过文本转语音收听助手的回复。

语音转文本功能和文本转语音功能可以在 AI Studio 聊天操场中一起使用,也可以单独使用。 可以在部署聊天模型之前使用操场来测试该模型。

先决条件

  • Azure 订阅 - 免费创建订阅

  • 已在所需的 Azure 订阅中授予对 Azure OpenAI 的访问权限。

    目前,仅应用程序授予对此服务的访问权限。 可以通过在 https://aka.ms/oai/access 上填写表单来申请对 Azure OpenAI 的访问权限。 如果有任何问题,请在此存储库上提出问题以联系我们。

  • 一个部署了聊天模型的 AI Studio 中心。 有关模型部署的详细信息,请参阅资源部署指南

  • 一个 AI Studio 项目

配置聊天操场

在启动聊天会话之前,需要将聊天操场配置为使用语音转文本功能和文本转语音功能。

  1. 登录到 Azure AI Studio

  2. 转到你的项目或在 Azure AI Studio 中创建新项目

  3. 从左侧窗格中选择“操场”>“聊天”

  4. 从“部署”下拉列表中选择部署的聊天模型。

    突出显示了模式和部署的聊天操场的屏幕截图。

  5. 选择“操场设置”按钮。

    包含用于访问操场设置选项的聊天操场屏幕截图。

    注意

    你还应会看到用于选择麦克风或扬声器按钮的选项。 如果你选择上述任一按钮,但尚未启用语音转文本功能或文本转语音功能,系统会提示你在“操场设置”中启用它们。

  6. 在“操场设置”页上,选中相应的框以确认知晓使用语音功能会产生额外费用。 有关详细信息,请参阅 Azure AI 语音定价

  7. 选择“启用语音转文本”和“启用文本转语音”。

    操场设置页屏幕截图。

  8. 选择你想要用于讲话和收听的语言区域设置和语音。 可用语音的列表取决于你选择的区域设置。

    包含已选中说出日语语音的操场设置页屏幕截图。

  9. (可选)可以输入一些示例文本,然后选择“播放”以尝试收听语音。

  10. 选择“保存”。

启动聊天会话

在此聊天会话中,你将同时使用语音转文本和文本转语音。 你将使用语音转文本功能来与助手交谈,并使用文本转语音功能来收听助手的回复。

  1. 如果你尚未完成配置操场部分中的步骤,现在请完成。 若要完成本快速入门,需要启用语音转文本和文本转语音功能。

  2. 选择麦克风按钮并与助手交谈。 例如,可以说出“你是否知道在何处可以购买 Xbox”。

    突出显示了已启用的麦克风图标和发送按钮的聊天会话屏幕截图。

  3. 选择“发送”按钮(右箭头)将消息发送给助手。 助手的回复将显示在聊天会话窗格中。

    包含助手响应的聊天会话屏幕截图。

    注意

    如果扬声器按钮已打开,你将听到助手的回复。 如果扬声器按钮已关闭,你将听不到助手的回复,但回复仍会显示在聊天会话窗格中。

  4. 可以更改系统提示来更改助手的回复格式或风格。

    例如,输入:

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    回复显示在聊天会话窗格中。 由于扬声器按钮已打开,因此你还可以听到回复。

    包含已编辑系统提示的聊天会话屏幕截图。

查看示例代码

可以选择“查看代码”按钮来查看和复制示例代码,其中包括 Azure OpenAI 和语音服务的配置。

屏幕截图显示用于在操场中查看示例代码的按钮。

可以使用示例代码在应用程序中启用语音转文本和文本转语音。

查看操场中代码的屏幕截图。

提示

有关其他示例,请参阅语音到语音聊天代码示例

清理资源

为了避免产生不必要的 Azure 成本,如果不再需要在本快速入门中创建的资源,应该将其删除。 若要管理资源,可以使用 Azure 门户

后续步骤