Cuotas y límites del servicio de voz

Este artículo contiene una referencia rápida y una descripción detallada de las cuotas y los límites del servicio de voz de Azure Cognitive Services. La información se aplica a todos los planes de tarifa del servicio. También contiene algunos procedimientos recomendados para evitar la limitación de solicitudes.

Referencia de las cuotas y límites

En las secciones siguientes se proporciona una guía rápida sobre las cuotas y límites que se aplican al servicio de voz.

Cuotas y límites de la conversión de voz en texto por recurso

En las tablas siguientes, los parámetros sin la fila Ajustable no son ajustables en todos los planes de tarifa.

Transcripción en línea

Puede usar la transcripción en línea con el SDK de Voz o la API REST de conversión de voz en texto para audio breve.

Quota Gratis (F0)1 Estándar (S0)
Límite de solicitudes simultáneas: punto de conexión de modelo base 1 100 (valor predeterminado)
Ajustable No2 2
Límite de solicitudes simultáneas: punto de conexión personalizado 1 100 (valor predeterminado)
Ajustable No2 2

Transcripción de Azure Batch

Quota Gratis (F0)1 Estándar (S0)
Límite de API REST v2.0 y v3.0 de conversión de voz en texto No disponible para F0 300 solicitudes por minuto
Tamaño máximo del archivo de entrada de audio N/D 1 GB
Tamaño máximo del blob de entrada (por ejemplo, puede contener más de un archivo en un archivo ZIP). Tenga en cuenta el límite del tamaño de archivo de la fila anterior. N/D 2,5 GB
Tamaño máximo de contenedor de blobs N/D 5 GB
Número máximo de blobs por contenedor N/D 10000
Número máximo de archivos por solicitud de transcripción (cuando se usan varias direcciones URL de contenido como entrada). N/D 1000

Personalización de modelos

Quota Gratis (F0)1 Estándar (S0)
Límite de API REST 300 solicitudes por minuto 300 solicitudes por minuto
Número máximo de conjuntos de datos de voz 2 500
Tamaño máximo del archivo de conjunto de datos acústicos para la importación de datos 2 GB 2 GB
Tamaño máximo del archivo de conjunto de datos de idioma para la importación de datos 200 MB 1,5 GB
Tamaño máximo del archivo de conjunto de datos de pronunciación para la importación de datos 1 KB 1 MB
Tamaño máximo del texto cuando se usa el parámetro text en la solicitud de API Crear modelo 200 KB 500 kB

1 Para el plan de tarifa Gratis (F0), consulte también las asignaciones mensuales en la página de precios.
2 Consulte las explicaciones adicionales, los procedimientos recomendados y las instrucciones de ajuste.

Cuotas y límites de la conversión de texto a voz por recurso

En las tablas siguientes, los parámetros sin la fila Ajustable no son ajustables en todos los planes de tarifa.

General

Quota Gratis (F0)3 Estándar (S0)
Número máximo de transacciones por determinados períodos de tiempo por recurso del servicio de voz
API en tiempo real. Voces neuronales precompiladas y voces neuronales personalizadas 20 transacciones por 60 segundos 200 transacciones por segundo (TPS).(valor predeterminado)
Ajustable No4 5, hasta 1000 TPS
Cuotas específicas de HTTP
Longitud máxima de audio generada por solicitud 10 min 10 min
Número máximo total de etiquetas <voice> y <audio> distintivas en SSML 50 50
Cuotas específicas de WebSocket
Longitud máxima de audio generada por turno 10 min 10 min
Número máximo total de etiquetas <voice> y <audio> distintivas en SSML 50 50
Tamaño máximo de mensaje SSML por turno 64 KB 64 KB

Long Audio API

Quota Gratis (F0)3 Estándar (S0)
Longitud mínima del texto N/D 400 caracteres para texto sin formato; 400 caracteres facturables para SSML
Longitud máxima del texto N/D 10 000 párrafos
Hora de inicio N/D 10 tareas o 10 000 caracteres acumulados

Voz neuronal personalizada

Quota Gratis (F0)3 Estándar (S0)
Número máximo de transacciones por segundo (TPS) por recurso del servicio de voz No disponible para F0 Consulte la sección General.
Número máximo de conjuntos de datos por recurso del servicio de voz N/D 500
Número máximo de cargas simultáneas de conjuntos de datos por recurso del servicio de voz N/D 5
Tamaño máximo de archivo de datos para la importación de datos por conjunto de datos N/D 2 GB
Carga de audios largos o audios sin script N/D
Número máximo de entrenamientos de modelo simultáneos por recurso del servicio de voz N/D 3
Número máximo de puntos de conexión personalizados por recurso del servicio de voz No aplicable 50
Límite de solicitudes simultáneas para Voz neuronal personalizada
Valor predeterminado N/D 10
Ajustable N/D 5

Herramienta de Creación de contenido de audio

Quota Gratis (F0) Estándar (S0)
Tamaño de archivo 3000 caracteres por archivo 20 000 caracteres por archivo
Exportar a biblioteca de audio 1 tarea simultánea N/D

3 Para el plan de tarifa Gratis (F0), consulte también las asignaciones mensuales en la página de precios.
4 Consulte las explicaciones adicionales y los procedimientos recomendados.
5 Consulte las explicaciones adicionales, los procedimientos recomendados y las instrucciones de ajuste.

Descripción detallada, ajuste de cuota y procedimientos recomendados

Antes de solicitar un aumento de cuota (en los casos en que sea aplicable), asegúrese de que es necesario. El servicio de voz usa tecnologías de escalado automático para poner los recursos informáticos necesarios en modo "A petición". Al mismo tiempo, para conservar bajos los costos, el servicio de voz intenta no mantener una cantidad excesiva de capacidad de hardware.

Veamos un ejemplo. Supongamos que la aplicación recibe el código de respuesta 429, que indica que hay demasiadas solicitudes. La aplicación recibe esta respuesta aunque la carga de trabajo esté dentro de los límites definidos en Referencia de las cuotas y límites. La explicación más probable es que el servicio de voz se esté escalando verticalmente para satisfacer su demanda y aún no haya llegado al escalado necesario. Por lo tanto, el servicio no tiene de forma inmediata suficientes recursos para atender la solicitud. En la mayoría de los casos, este estado de limitación es transitorio.

Procedimientos recomendados generales para mitigar la limitación durante el escalado automático

Para minimizar los problemas relacionados con la limitación, es una buena idea usar las técnicas siguientes:

  • Implemente lógica de reintento en la aplicación.
  • Evite cambios bruscos en la carga de trabajo. Aumente la carga de trabajo gradualmente. Por ejemplo, supongamos que la aplicación usa la conversión de texto a voz y la carga de trabajo actual es de 5 TPS. En el siguiente segundo, aumenta la carga a 20 TPS (es decir, cuatro veces más). El servicio de voz comienza inmediatamente a escalarse verticalmente para satisfacer la nueva carga, pero no puede hacerlo en un segundo. Algunas de las solicitudes recibirán el código de respuesta 429 (demasiadas solicitudes).
  • Prueba de diferentes patrones de aumento de carga Para más información, consulte el ejemplo de patrón de carga de trabajo.
  • Cree recursos adicionales del servicio de Voz en diferentes regiones, y distribuya la carga de trabajo entre ellas. (La creación de varios recursos de servicio de Voz en la misma región no afectará al rendimiento, ya que el mismo clúster de back-end atenderá todos los recursos).

En las secciones siguientes se describen los casos específicos de ajuste de las cuotas.

Conversión de voz en texto: aumento del límite de solicitudes simultáneas de transcripciones en línea

De forma predeterminada, el número de solicitudes simultáneas está limitado a 100 por recurso en el modelo base y a 100 por punto de conexión personalizado en el modelo personalizado. En el caso del plan de tarifa estándar, puede aumentar esta cantidad. Antes de enviar la solicitud, asegúrese de que está familiarizado con el material mencionado anteriormente en este artículo, como los procedimientos recomendados para mitigar la limitación.

Nota

Si usa modelos personalizados, tenga en cuenta que un recurso del servicio de voz puede estar asociado a muchos puntos de conexión personalizados que hospedan muchas implementaciones de modelos personalizados. Cada punto de conexión personalizado tiene un límite predeterminado de solicitudes simultáneas (100) establecido en su creación. Si necesita ajustarlo, debe realizar el ajuste de cada punto de conexión personalizado por separado. Tenga en cuenta también que el límite de solicitudes simultáneas del modelo base de un recurso no tiene ningún efecto en los puntos de conexión personalizados asociados a este recurso.

Aumentar el límite de solicitudes simultáneas no afecta directamente a los costos. El servicio de voz usa un modelo de pago que requiere que solo se pague por lo que se usa. El límite define hasta dónde se puede escalar el servicio antes de empezar a limitar las solicitudes.

Los límites de solicitudes simultáneas de los modelos base y personalizado se deben ajustar por separado.

No puede ver el valor existente del parámetro de límite de solicitudes simultáneas en Azure Portal, ni en las herramientas de línea de comandos ni en las solicitudes de API. Para comprobar el valor existente, cree una solicitud de soporte técnico de Azure.

Nota

Los contenedores de voz no requieren aumentos en los límites de solicitudes simultáneas, ya que solo están restringidos por las CPU del hardware en el que se hospedan. Sin embargo, los contenedores de voz tienen sus propias limitaciones de capacidad que deben tenerse en cuenta. Para más información, consulte las preguntas más frecuentes sobre los contenedores de voz.

Tenga lista la información necesaria

  • Para el modelo base:
    • Identificador del recurso de voz
    • Region
  • Para el modelo personalizado:
    • Region
    • Identificador del punto de conexión personalizado

Para obtener información para el modelo base:

  1. Vaya a Azure Portal.
  2. Seleccione el recurso del servicio de voz para el que desea aumentar el límite de solicitudes simultáneas.
  3. En el grupo Administración de recursos, seleccione Propiedades.
  4. Copie y guarde los valores de los siguientes campos:
    • Identificador del recurso
    • Ubicación (la región del punto de conexión)

Para obtener información para el modelo personalizado:

  1. Vaya al portal de Speech Studio.
  2. Inicie sesión si es necesario y vaya a Habla personalizada.
  3. Seleccione el proyecto y vaya a Implementación.
  4. Seleccione el punto de conexión necesario.
  5. Copie y guarde los valores de los siguientes campos:
    • Service Region (Región del servicio) (la región del punto de conexión)
    • Endpoint ID (Id. del punto de conexión)

Creación y envío de una solicitud de soporte técnico

Inicie el aumento del límite de solicitudes simultáneas para el recurso o, si es necesario, compruebe el límite actual enviando una solicitud de soporte técnico: A continuación se muestra cómo hacerlo:

  1. Asegúrese de que tiene la información necesaria enumerada en la sección anterior.
  2. Vaya a Azure Portal.
  3. Seleccione el recurso del servicio de voz para el que le gustaría aumentar (o comprobar) el límite de solicitudes simultáneas
  4. En el grupo Soporte técnico y solución de problemas, seleccione Nueva solicitud de soporte técnico. Aparecerá una nueva ventana con información rellenada automáticamente sobre la suscripción y el recurso de Azure.
  5. En Resumen, describa lo que desea (por ejemplo, "Aumentar el límite de solicitudes simultáneas de la conversión de voz en texto").
  6. En Tipo de problema, seleccione Quota or Subscription issues (Problemas de cuota o suscripción).
  7. En Subtipo de problema, seleccione:
    • Quota or concurrent requests increase (Aumento de cuota o solicitudes simultáneas) para aumentar las solicitudes.
    • Quota or usage validation (Validación de cuota o uso) para comprobar el límite existente.
  8. Seleccione Siguiente: Soluciones. Continúe con la creación de la solicitud.
  9. En la pestaña Detalles, escriba lo siguiente en el campo Descripción:
    • Tenga en cuenta que la solicitud es sobre la cuota de conversión de voz en texto.
    • Elija el modelo base o personalizado.
    • La información de recursos de Azure que recopiló anteriormente.
    • Cualquier otra información necesaria.
  10. En la pestaña Revisar y crear, seleccione Crear.
  11. Anote el número de la solicitud de soporte técnico que aparece en las notificaciones de Azure Portal. En breve se pondrán en contacto con usted para obtener información sobre su solicitud.

Ejemplo de un procedimiento recomendado para un patrón de carga de trabajo

Este es un ejemplo general de un buen enfoque. Solo está pensado como una plantilla que se puede ajustar según sea necesario para su propio uso.

Suponga que un recurso del servicio de voz tiene el límite de solicitudes simultáneas establecido en 300. Inicie la carga de trabajo en 20 conexiones simultáneas y aumente la carga en 20 conexiones simultáneas cada 90-120 segundos. Controle las respuestas del servicio e implemente la lógica que invierte la operación (reduce la carga) si se reciben demasiadas solicitudes (códigos de respuesta 429). A continuación, vuelva a intentar el aumento de carga en un minuto y, si sigue sin funcionar, inténtelo de nuevo dentro de dos minutos. Use un patrón de 1-2-4-4 minutos para los intervalos.

Por lo general, es buena idea probar la carga de trabajo y los patrones de carga de trabajo antes de pasar a producción.

Texto a voz: aumento del límite de solicitudes simultáneas

En el caso del plan de tarifa estándar, puede aumentar esta cantidad. Antes de enviar la solicitud, asegúrese de que está familiarizado con el material mencionado anteriormente en este artículo, como los procedimientos recomendados para mitigar la limitación.

Aumentar el límite de solicitudes simultáneas no afecta directamente a los costos. El servicio de voz usa un modelo de pago que requiere que solo se pague por lo que se usa. El límite define hasta dónde se puede escalar el servicio antes de empezar a limitar las solicitudes.

No puede ver el valor existente del parámetro de límite de solicitudes simultáneas en Azure Portal, ni en las herramientas de línea de comandos ni en las solicitudes de API. Para comprobar el valor existente, cree una solicitud de soporte técnico de Azure.

Nota

Los contenedores de voz no requieren aumentos en los límites de solicitudes simultáneas, ya que solo están restringidos por las CPU del hardware en el que se hospedan.

Preparación de la información necesaria

Para crear una solicitud de aumento, proporcione la región de implementación y el identificador del punto de conexión personalizado. Para obtenerlo, realice las acciones siguientes:

  1. Vaya al portal de Speech Studio.
  2. Inicie sesión si es necesario y vaya a Voz personalizada.
  3. Seleccione el proyecto y vaya a Implementación.
  4. Seleccione el punto de conexión necesario.
  5. Copie y guarde los valores de los siguientes campos:
    • Service Region (Región del servicio) (la región del punto de conexión)
    • Endpoint ID (Id. del punto de conexión)

Creación y envío de una solicitud de soporte técnico

Inicie el aumento del límite de solicitudes simultáneas para el recurso o, si es necesario, compruebe el límite actual enviando una solicitud de soporte técnico: A continuación se muestra cómo hacerlo:

  1. Asegúrese de que tiene la información necesaria enumerada en la sección anterior.
  2. Vaya a Azure Portal.
  3. Seleccione el recurso del servicio de voz para el que le gustaría aumentar (o comprobar) el límite de solicitudes simultáneas
  4. En el grupo Soporte técnico y solución de problemas, seleccione Nueva solicitud de soporte técnico. Aparecerá una nueva ventana con información rellenada automáticamente sobre la suscripción y el recurso de Azure.
  5. En Resumen, describa lo que desea (por ejemplo, "Aumentar el límite de solicitudes simultáneas de conversión de texto a voz").
  6. En Tipo de problema, seleccione Quota or Subscription issues (Problemas de cuota o suscripción).
  7. En Subtipo de problema, seleccione:
    • Quota or concurrent requests increase (Aumento de cuota o solicitudes simultáneas) para aumentar las solicitudes.
    • Quota or usage validation (Validación de cuota o uso) para comprobar el límite existente.
  8. Seleccione Siguiente: Soluciones. Continúe con la creación de la solicitud.
  9. En la pestaña Detalles, escriba lo siguiente en el campo Descripción:
    • Tenga en cuenta que la solicitud es sobre la cuota de conversión de texto a voz.
    • Elija el modelo base o personalizado.
    • La información de recursos de Azure que recopiló anteriormente.
    • Cualquier otra información necesaria.
  10. En la pestaña Revisar y crear, seleccione Crear.
  11. Anote el número de la solicitud de soporte técnico que aparece en las notificaciones de Azure Portal. En breve se pondrán en contacto con usted para obtener información sobre su solicitud.