你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

什么是语音设备？

项目
01/22/2024

语音服务适用于多种设备和音频源。可以使用设备上提供的默认音频处理。或者，可以使用语音 SDK 提供的另一种选择，即使用我们的高级音频处理算法，这些算法旨在与语音服务很好地配合使用。它通过噪声抑制、回声消除、波束赋形和混响消减来提供准确的远场语音识别。

音频处理

音频处理是应用于音频流的增强功能，以提高音频质量。常见的增强功能示例包括自动增益控制 (AGC)、噪音抑制和回声消除 (AEC)。语音 SDK 集成 Microsoft 音频堆栈 (MAS)，允许任何应用程序或产品对输入音频使用其音频处理功能。

麦克风阵列建议

语音 SDK 最适合与根据推荐指南设计的麦克风阵列配合使用。有关详细信息，请参阅麦克风阵列建议。

设备开发工具包

语音 SDK 旨在与特制的开发工具包和各种麦克风阵列配置配合使用。例如，你可以使用下列其中一个 Azure 开发工具包。

Azure Percept DK 包含预配置的音频处理器和四麦克风线性阵列。你可以借助 Azure AI 服务使用语音命令、关键字辨识和远场语音。
Azure Kinect DK 是一个空间计算开发人员工具包，配有先进的 AI 传感器，提供复杂的 Azure AI 视觉和语音模型。作为具有多种模式的一体式小型设备，它包含了深度传感器、附带视频相机的空间麦克风阵列和方向传感器。

后续步骤

音频处理的概念