Introducción al dispositivo Azure Percept Audio

Artículo
02/07/2023

Importante

Retirada de Azure Percept DK:

Actualización 22 de febrero de 2023: Una actualización de firmware para los componentes de accesorios Percept DK Vision y Audio (también conocidos como Vision y Audio SOM) ya está disponible aquí y permitirá que los componentes de accesorio sigan funcionando más allá de la fecha de retirada.

La versión preliminar pública de Azure Percept evolucionará para admitir nuevas plataformas de dispositivos perimetrales y experiencias de desarrollador. Como parte de esta evolución, Azure Percept DK y el accesorio Audio y los servicios auxiliares de Azure asociados para Percept DK se retirarán el 30 de marzo de 2023.

A partir del 30 de marzo de 2023, los servicios de Azure Percept DK y el accesorio Audio ya no serán compatibles con ningún servicio de Azure, incluidas las Azure Percept Studio, las actualizaciones del sistema operativo, las actualizaciones de contenedores, la visualización de secuencias web y la integración de Custom Vision. Microsoft ya no proporcionará soporte técnico al cliente ni ningún servicio auxiliar asociado. Para obtener más información, consulte la entrada de blog Aviso de retirada.

Azure Percept Audio es un dispositivo accesorio que agrega funcionalidades de voz con inteligencia artificial a Azure Percept DK. Contiene un procesador de audio preconfigurado y una matriz lineal de cuatro micrófonos, lo que permite usar comandos de voz, detección de palabras clave y reconocimiento de voz a gran distancia mediante Azure Cognitive Services. Se integra de forma perfecta con Azure Percept DK, Azure Percept Studio y otros servicios de administración perimetral de Azure.

Componentes de Azure Percept Audio

Azure Percept Audio contiene los siguientes componentes principales:

Dispositivo de Azure Percept Audio (módulo de sistema) listo para producción con una matriz lineal de cuatro micrófonos y procesamiento de audio mediante un códec XMOS.
Placa para desarrolladores (intermediador) que incluye 2 botones, 3 indicadores LED, micro USB y conector de audio de 3,5 mm.
Cables necesarios: cable FPC, micro USB tipo B a USB A
Tarjeta de bienvenida
Placa de montaje mecánico con montaje de serie 80/20 1010 integrado

Capacidades de proceso

Azure Percept Audio pasa la entrada de audio a través de la pila de voz que se ejecuta en la CPU de la placa base del dispositivo Azure Percept DK en forma híbrida de nube-perímetro. Por lo tanto, Azure Percept Audio necesita una placa base con un sistema operativo que admita la pila de voz para funcionar.

El procesamiento de audio se realiza del siguiente modo:

Azure Percept Audio: captura y convierte el audio y lo envía al DK y a la toma de audio.
Azure Percept DK: la pila de voz se ocupa de conformar los haces y cancelar el eco, y procesa el audio entrante para optimizar la voz. Después del procesamiento, realiza la búsqueda de palabras clave.
Nube: procesa comandos y frases de lenguaje natural, comprueba las palabras clave y repite el entrenamiento.
Sin conexión: si el dispositivo está sin conexión, detectará la palabra clave y capturará la telemetría del estado de conexión a Internet. Se puede observar un aumento falso de la tasa de aceptación en la detección de palabras clave, ya que no se puede realizar la comprobación de palabras clave en la nube.

Introducción

Creación de un prototipo sin código

Cree una solución de voz sin código en Azure Percept Studio mediante las plantillas del asistente para voz de Azure Percept para escenarios de hostelería, asistencia sanitaria, inventario y automoción.

Introducción al dispositivo Azure Percept Audio

Componentes de Azure Percept Audio

Capacidades de proceso

Introducción

Creación de un prototipo sin código

Administración de la solución de voz sin código

Información técnica adicional

Recursos adicionales