¿Qué es la transcripción por lotes?

Importante

Los nuevos precios están en vigor para la transcripción por lotes a través de la API REST de conversión de voz en texto v3.2. Para obtener más información, consulte la guía de precios.

La transcripción por lotes se usa para transcribir una gran cantidad de datos de audio en el almacenamiento. Tanto Speech-to-text REST API como la CLI de Voz admiten la transcripción por lotes.

Debe proporcionar varios archivos por solicitud o apuntar a un contenedor de Azure Blob Storage con los archivos de audio que se transcribirán. El servicio transcripción por lotes puede controlar un elevado número de transcripciones enviadas. El servicio transcribe los archivos simultáneamente, lo que reduce el tiempo de respuesta.

¿Cómo funciona?

Con las transcripciones por lotes, se envían los datos de audio y, después, se recuperan los resultados de la transcripción de forma asincrónica. El servicio transcribe los datos de audio y almacena los resultados en un contenedor de almacenamiento. Después, puede recuperar los resultados del contenedor de almacenamiento.

Sugerencia

Para una solución con poco código o sin código, puede usar el conector de conversión de voz en texto por lotes en aplicaciones de Power Platform, como Power Automate, Power Apps y Logic Apps. Consulte la guía de transcripción por lotes de Power Automate para empezar.

Para usar la API de REST de transcripción por lotes:

  1. Búsqueda de archivos de audio para la transcripción por lotes: puede cargar sus propios datos o usar archivos de audio existentes a través del URI público o el URI de firma de acceso compartido (SAS).
  2. Cree una solicitud POST para la transcripción por lotes: envíe el trabajo de transcripción con parámetros como los archivos de audio, el idioma de transcripción y el modelo de transcripción.
  3. Obtención de resultados de transcripción por lotes: compruebe el estado de la transcripción y recupere los resultados de la transcripción de forma asincrónica.

Importante

Los trabajos de transcripción por lotes se programan de la mejor manera posible. En horas punta, puede tardar hasta 30 minutos o más en iniciar el procesamiento de un trabajo de transcripción. Consulte cómo comprobar el estado actual de un trabajo de transcripción por lotes en esta sección.

Pasos siguientes