Compartir por


Límites de los servicios de IA de escalabilidad automática

En este artículo se proporcionan instrucciones sobre cómo los clientes pueden acceder a los límites de frecuencia más altos en sus recursos de servicios de Azure AI.

Información general

Cada recurso de servicios de Azure AI tiene una tasa de llamadas estáticas preconfigurada (transacciones por segundo) que limita el número de llamadas simultáneas que los clientes pueden realizar en el servicio backend en un período de tiempo determinado. La característica de escalabilidad automática aumentará o reducirá automáticamente los límites de frecuencia de un recurso del cliente en función de las métricas de uso de recursos casi en tiempo real y las métricas de capacidad del servicio back-end.

Introducción a la característica de escalabilidad automática

Esta característica está deshabilitada de forma predeterminada para cada recurso nuevo. Siga estas instrucciones para habilitarla.

Vaya a la página del recurso en Azure Portal y seleccione la pestaña Información general en el panel izquierdo. En la sección Información esencial, busque la línea Escalabilidad automática y seleccione el vínculo para ver el panel Configuración de escalabilidad automática y habilite la característica.

Captura de pantalla de Azure Portal con el panel de escalabilidad automática a la derecha.

Preguntas más frecuentes

¿Al habilitar la característica de escalabilidad automática mi recurso dejará de tener limitaciones?

No, es posible que siga recibiendo errores 429 por el exceso del límite de frecuencia. Si la aplicación genera un pico y el recurso notifica una respuesta 429, la escalabilidad automática comprobará la sección de proyección de capacidad disponible para ver si la capacidad actual puede soportar un aumento del límite de frecuencia y responder en un plazo de cinco minutos.

Si la capacidad disponible es suficiente para un aumento, la escalabilidad automática aumenta gradualmente el límite de frecuencia del recurso. Si sigue llamando al recurso a una frecuencia alta que provoca un aumento del límite 429, la frecuencia de TPS seguirá aumentando con el tiempo. Si esta acción continúa durante una hora o más, debe alcanzar la frecuencia máxima (hasta 1000 TPS) disponible en ese momento para ese recurso.

Si la capacidad disponible no es suficiente para un aumento, la característica de escalabilidad automática espera cinco minutos y vuelve a comprobarlo.

¿Qué ocurre si necesito un límite de frecuencia predeterminado superior?

De forma predeterminada, los recursos de servicios de Azure AI tienen un límite de frecuencia predeterminado de 10 TPS. Si necesita un TPS predeterminado superior, envíe una incidencia siguiendo el vínculo Nueva solicitud de soporte técnico en la página del recurso de Azure Portal. Recuerde incluir una justificación comercial en la solicitud.

¿Esta característica aumentará el gasto de Azure?

Los precios de servicios de Azure AI no han cambiado y puede consultarlos aquí. Solo facturaremos las llamadas correctas realizadas a las API de servicios de Azure AI. Sin embargo, un aumento de los límites de frecuencia de llamada significa que se completan más transacciones y, por tanto, puede que reciba una factura por un importe superior.

Tenga en cuenta los posibles errores y sus consecuencias. Si un error en la aplicación cliente hace que llame al servicio cientos de veces por segundo, esto probablemente generaría una factura por una cuantía mucho más alta, mientras que el costo sería mucho más limitado con un límite de frecuencia fijo. Los errores de este tipo son su responsabilidad. Le recomendamos encarecidamente realizar pruebas de actualización de cliente y desarrollo en un recurso con un límite de frecuencia fijo antes de usar la característica de escalabilidad automática.

¿Puedo deshabilitar esta característica si prefiero limitar la frecuencia a tener gastos impredecibles?

Sí, puede deshabilitar la característica de escalabilidad automática a través de Azure Portal o la CLI y volver a la configuración predeterminada del límite de frecuencia de llamadas. Si el recurso se aprobó previamente para un TPS predeterminado superior, vuelve a esa frecuencia. Los cambios pueden tardar hasta cinco minutos en aplicarse.

¿Qué servicios admiten la característica de escalabilidad automática?

La característica de escalabilidad automática está disponible para los servicios siguientes:

¿Puedo probar esta característica con una suscripción gratuita?

No, la característica de escalabilidad automática no está disponible para las suscripciones de nivel Gratis.

Pasos siguientes