Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Use la transcripción por lotes para transcribir una gran cantidad de datos de audio en el almacenamiento. Tanto Speech-to-text REST API como la CLI de Voz admiten la transcripción por lotes.
Debe proporcionar varios archivos por solicitud o apuntar a un contenedor de Azure Blob Storage con los archivos de audio que se transcribirán. El servicio transcripción por lotes puede controlar un elevado número de transcripciones enviadas. El servicio transcribe los archivos simultáneamente, lo que reduce el tiempo de respuesta.
¿Cómo funciona?
Con las transcripciones por lotes, se envían los datos de audio y, después, se recuperan los resultados de la transcripción de forma asincrónica. El servicio transcribe los datos de audio y almacena los resultados en un contenedor de almacenamiento. Después, puede recuperar los resultados del contenedor de almacenamiento.
Sugerencia
Para una solución de poco código o sin código, use Batch Speech to text Connector en aplicaciones de Power Platform como Power Automate, Power Apps y Logic Apps. Consulte la guía de transcripción por lotes de Power Automate para empezar.
Para usar la API de REST de transcripción por lotes:
- Búsqueda de archivos de audio para la transcripción por lotes: puede cargar sus propios datos o usar archivos de audio existentes a través del URI público o el URI de firma de acceso compartido (SAS).
- Cree una solicitud POST para la transcripción por lotes: envíe el trabajo de transcripción con parámetros como los archivos de audio, el idioma de transcripción y el modelo de transcripción.
- Obtención de resultados de transcripción por lotes: compruebe el estado de la transcripción y recupere los resultados de la transcripción de forma asincrónica.
Importante
El servicio programa trabajos de transcripción por lotes de forma óptima. En horas punta, un trabajo de transcripción puede tardar hasta 30 minutos en iniciar el procesamiento y hasta 24 horas para completarse. Consulte cómo comprobar el estado actual de un trabajo de transcripción por lotes en esta sección.
Procedimientos recomendados para mejorar el rendimiento
Tamaño de solicitud: la transcripción por lotes es asincrónica y cada región procesa solicitudes de una en una. El envío de trabajos a una velocidad superior no acelera el procesamiento. Por ejemplo, enviar 600 o 6000 solicitudes por minuto no tiene ningún efecto en el rendimiento. Envíe aproximadamente 1000 archivos en una sola Transcription_Create solicitud para enviar menos solicitudes en general.
Distribución de tiempo: distribuya las solicitudes a lo largo del tiempo. Envíelos en varias horas en lugar de enviarlos todos en unos minutos. El procesamiento de back-end mantiene un nivel de rendimiento estable debido al ancho de banda fijo, por lo que el envío de solicitudes demasiado rápido no mejora el rendimiento.
Supervisión del trabajo: al supervisar el estado del trabajo, el sondeo cada pocos segundos no es necesario. Si envía varios trabajos, el servicio solo procesa el primer trabajo inicialmente; Los trabajos posteriores esperan hasta que se complete el primer trabajo. El sondeo de todos los trabajos aumenta con frecuencia la carga del sistema sin ventajas. Comprobar el estado cada 10 minutos es suficiente, y no se recomienda sondear con más frecuencia que una vez por minuto.
- Debido al procesamiento secuencial, puede obtener el estado del trabajo comprobando solo un subconjunto de los archivos: compruebe los primeros 100 archivos y, si no se completan, es probable que los lotes posteriores no se completen. Espere al menos un minuto (idealmente cinco minutos) antes de volver a comprobarlo.
Evite el tráfico máximo para las llamadas API: minimice las ListFilesllamadas API , Updatey Get durante los tiempos de tráfico máximo. Estas llamadas se comportan de forma similar a la Create llamada.
Equilibrio de carga: para optimizar el rendimiento de la transcripción por lotes a gran escala, considere la posibilidad de distribuir los trabajos entre varias regiones de Azure admitidas. Este enfoque puede ayudar a equilibrar la carga y reducir el tiempo de procesamiento general, siempre que los datos y los requisitos de cumplimiento permitan el uso de varias regiones. Revise la disponibilidad de la región y asegúrese de que el almacenamiento y los recursos son accesibles desde cada región que planea usar.