你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
2025 年 9 月 30 日,Foundry Tools 中的 Azure 语音中的意向识别已停用。 应用程序不能再通过语音使用意向识别。 但是,仍然可以在 Foundry 工具服务或 Azure OpenAI 中使用 Azure 语言执行意向识别。
此更改不会影响其他语音功能,例如 语音转文本 (包括不更改说话人分割)、 文本转语音和 语音翻译。
语音以前在语音 SDK 中公开了 IntentRecognizer 对象系列。 这些 API 依赖于语言理解智能服务(LUIS)应用程序或简单的模式匹配构造。 退役后:
-
IntentRecognizer、模式匹配意图/实体和相关参数已不可用。 - 现有应用程序必须删除直接语音 SDK 意图逻辑,并采用两步方法(语音转文本,然后进行意图分类)或基于单一提示的方法。
选择替代项
| Requirement | 建议的服务 | 为什么 |
|---|---|---|
| 使用带标签的训练数据进行结构化意向和实体提取 | 语言服务对话语言理解 (CLU) | 专为多意向分类和实体提取而构建;支持版本、测试和分析。 |
| 少样本或零样本动态意向确定 | Azure OpenAI | 使用带有示例提示的 GPT 模型;在不更改架构的情况下快速适应。 |
| 将转录与生成推理相结合(摘要 + 意向) | Azure OpenAI + 语音 | 先转录音频,然后通过 GPT 的输出来丰富内容,以便进行复杂的推理。 |
| 多语言语音输入流入一致的意向架构 | 语音识别(STT) + 语义理解(CLU) | 语音处理听录;CLU 处理规范化和分类。 |
迁移步骤
- 将任何语音 SDK
IntentRecognizer的用法替换为SpeechRecognizer或ConversationTranscriber,以便获取文本。 - 对于结构化意向/实体需求,请创建 CLU 项目并部署模型。 将转录的话语发送到 CLU 预测 API。
- 对于灵活或快速的方案,请为 Azure OpenAI 模型创建提示,包括具有代表性的用户话语和预期的 JSON 意向输出。
- 从配置中删除对
LanguageUnderstandingModel、任何 LUIS 应用程序 ID 和终结点的依赖。 - 消除引用
PatternMatchingIntent或PatternMatchingEntity类型的模式匹配代码。 - 通过将历史
IntentRecognizer输出与 CLU 分类结果或 OpenAI 完成进行比较、根据需要调整训练数据或提示来验证准确性。 - 更新监视:将任何现有意向延迟/准确性仪表板迁移至新的源(CLU 评估日志或 OpenAI 提示结果跟踪)。
示例体系结构
- 语音转文本将音频转录为具有实时或批处理模式的文本。
- 根据意向策略,文本将发送到 CLU 或 Azure OpenAI。
- 响应规范化为常见的 JSON 形状(例如:
{ "intent": "BookFlight", "entities": { "Destination": "Seattle" } }) 。 - 业务逻辑将规范化输出路由到下游服务(预订、知识库、工作流引擎)。
结果格式注意事项
| 方面 | CLU | Azure OpenAI |
|---|---|---|
| 架构稳定性 | 高(定义的意向/实体) | 灵活(提示定义) |
| 版本控制 | 内置模型版本 | 手动命令版本控制 |
| 培训工作 | 需要标记的数据集 | 提示中的少样本示例 |
| 边缘事例 | 需要更多标记的数据 | 添加示例或说明 |
| 延迟 | 预测 API 调用 | 完成 API 调用(类似) |
常见问题
是否需要重新标记数据? 如果使用 LUIS,则需要将数据导出并重新导入 CLU,然后重新训练。 映射通常是直接的(意图、实体)。 模式匹配的意图可能需要手动转换为示例。
是否可以合并 CLU 和 Azure OpenAI? 是的。 将 CLU 用于确定性分类,在置信度较低时使用 OpenAI 进行汇总或回退分类。
说话人分割是否受到影响? 否。 分割功能继续可用;只需在听录后通过 CLU 或 OpenAI 处理每个演讲者片段即可。