Cliente de ingesta con servicios de Azure AI

El cliente de ingesta es una herramienta publicada por Microsoft en GitHub que ayuda a implementar rápidamente una solución de transcripción de centro de llamadas en Azure con un enfoque sin código.

Sugerencia

Puede usar la herramienta y la solución resultante en producción para procesar un gran volumen de audio.

Cliente de ingesta usa Lenguaje de Azure AI, Voz de Azure AI, almacenamiento de Azure y Azure Functions.

Introducción al cliente de ingesta

Se necesita una cuenta de Azure y un recurso de varios servicios de Azure AI para ejecutar el cliente de ingesta.

En la Introducción al cliente de ingesta de GitHub se describe la configuración y el uso de la herramienta.

Características del cliente de ingesta

El cliente de ingesta funciona mediante la conexión de una cuenta de Azure Storage dedicada con instancias de Azure Functions personalizadas sin servidor para pasar solicitudes de transcripción al servicio. Los archivos de audio transcritos llegan al contenedor de Azure Storage dedicado.

Importante

Los precios varían en función del modo de operación (por lotes frente a tiempo real), así como de la SKU de Azure Functions seleccionada. De manera predeterminada, la herramienta creará una SKU Premium de Azure Functions para controlar grandes volúmenes. Visite la página de precios para más información.

Internamente, la herramienta usa los servicios de voz y lenguaje, y sigue los procedimientos recomendados para controlar el escalado vertical, los reintentos y la conmutación por error. En el esquema siguiente se describen los recursos y las conexiones.

Diagram that shows the Ingestion Client Architecture.

El cliente de ingesta usa la siguiente característica del servicio de voz:

  • Conversión de voz en texto en lote: para transcribir grandes cantidades de archivos de audio de forma asincrónica, incluida la diarización del hablante; se suele usar en escenarios de análisis posteriores a llamadas. La diarización es el proceso de reconocer y separar los hablantes en datos de audio monocanal.

Estas son algunas características del servicio de lenguaje que usa el cliente de ingesta:

Además de servicios de Azure AI, la solución se completa con estos productos de Azure:

  • Cuenta de almacenamiento de Azure: se utiliza para almacenar los datos de telefonía y las transcripciones que devuelve la API de transcripciones por lotes. Esta cuenta de almacenamiento debe utilizar notificaciones, específicamente para cuando se agregan nuevos archivos. Estas notificaciones se utilizan para desencadenar el proceso de transcripción.
  • Azure Functions: se utiliza para crear un identificador URI de firmas de acceso compartido (SAS) para cada grabación y desencadenar la petición HTTP POST para iniciar una transcripción. Además, utilice Azure Functions para crear solicitudes de recuperación y eliminación de transcripciones mediante la API Batch Transcription.

Personalización de la herramienta

La herramienta se creó para mostrar los resultados de los clientes rápidamente. Puede personalizar la herramienta para las SKU y la configuración de su preferencia. Las SKU se pueden editar desde Azure Portal y el propio código está disponible en GitHub.

Nota

Se recomienda crear los recursos en el mismo grupo de recursos dedicado para comprender y mantener un seguimiento de los costos más fácilmente.

Pasos siguientes