Translate
Implementación con API sin servidor (pago por uso) o modelo como servicio (MaaS)
Descripción del problema:
- Recurso afectado: Punto de conexión sin servidor (serverless) de Llama 4 en el Azure Machine Learning workspace “Llama_4”.
Síntoma: Hemos alcanzado el límite configurado de 50 invocaciones, lo que provoca errores de “límite superado” y bloquea nuevas peticiones al modelo.
Impacto: Detiene las pruebas/servicio de inferencia automatizada en nuestros flujos de trabajo actuales.
Petición:
Elevar el límite de invocaciones para este endpoint serverless de Llama 4 (o indicarnos cómo solicitar un incremento de cuota).
Confirmar si el consumo de este tipo de endpoint sin servidor se cobra contra los créditos gratuitos de Azure o si se factura de forma independiente bajo otro tipo de suscripción/plan.
Quedo atento a cualquier dato adicional que necesiten. ¡Gracias!Descripción del problema:
Recurso afectado: Punto de conexión sin servidor (serverless) de Llama 4 en el Azure Machine Learning workspace “Llama_4”.
Síntoma: Hemos alcanzado el límite configurado de 50 invocaciones, lo que provoca errores de “límite superado” y bloquea nuevas peticiones al modelo.
Impacto: Detiene las pruebas/servicio de inferencia automatizada en nuestros flujos de trabajo actuales.
Petición:
Elevar el límite de invocaciones para este endpoint serverless de Llama 4 (o indicarnos cómo solicitar un incremento de cuota).
Confirmar si el consumo de este tipo de endpoint sin servidor se cobra contra los créditos gratuitos de Azure o si se factura de forma independiente bajo otro tipo de suscripción/plan.
Quedo atento a cualquier dato adicional que necesiten.
¡Gracias!