部署必要的扩展

已完成

支持语音的 Microsoft Copilot Studio 代理的基本行为与传统代理并非完全不同。 从设计的角度来看,创建代理时不需要执行任何特殊操作。 主题、实体和其他元素等项目的设计方式完全相同。 主要区别在于,代理不是通过基于文本的通信形式与客户交互,而是通过语音对话与他们互动。 为了确保此流程按预期进行,您需要将多个扩展安装到环境中,以确保正确处理各个方面。

您需要执行一些配置才能为代理设置语音功能。 所有语音设置都可以通过转到设置>语音来访问。 最初,代理未针对语音进行优化。 通过选择针对语音进行优化,其他语音功能将变为可用。

启用针对语音进行优化后,您可以更新以下设置:

  • 使用语音作为主要创作模式:

  • 利用代理数据提高准确性:允许您根据代理的内容向语音识别模型添加特定于语音的数据。 这会增加代理发布所需的时间。

  • 超时:

    • DTMF:包括不同的设置,有助于定义代理如何从拨号盘接收输入。 有两个设置需要修改:

      • 拨号间隔超时:当您的用户未达到最大输入长度时,此超时限制适用。 它仅适用于多位 DTMF 输入。

      • 终止超时:当用户达到最大输入长度且未按下终止键时,此超时限制适用。 它仅适用于多位 DTMF 输入。

    • 静默检测:允许您指定代理在未检测到最终用户的任何输入时如何响应。 该设置是二进制的,可以启用,也可以禁用。

    • 语音收集:允许您对代理尝试检测和收集输入数据的时间设置限制。 它包括以下设置:

      • 语句结束超时:当用户在语音期间或之后暂停时,此超时限制适用。 如果暂停时间超过超时限制,代理会表现得好像用户已说完话。

      • 语音识别超时:此超时限制用于确定代理在用户开始说话后允许用户输入的时间。

    • 延迟消息:允许您选择当后台操作所需的时间超过预期时,用户如何以及何时听到延迟消息。 它包括以下设置:

      • 发送消息延迟:此设置确定在后台操作请求启动后,代理在发送延迟消息之前等待多长时间。

      • 最短播放时间:延迟消息播放的最少时间量,即使后台操作在消息播放时完成也是如此。

    • 语音敏感度:控制对语音的敏感度级别。 较低的设置会过滤掉更多的背景噪音。 较高的设置最适合安静的环境。