Implementación con API sin servidor (pago por uso) o modelo como servicio (MaaS)

Question

Implementación con API sin servidor (pago por uso) o modelo como servicio (MaaS)

Borja Hoyos 0

Descripción del problema:

Recurso afectado: Punto de conexión sin servidor (serverless) de Llama 4 en el Azure Machine Learning workspace “Llama_4”.

Síntoma: Hemos alcanzado el límite configurado de 50 invocaciones, lo que provoca errores de “límite superado” y bloquea nuevas peticiones al modelo.

Impacto: Detiene las pruebas/servicio de inferencia automatizada en nuestros flujos de trabajo actuales.

Petición:

Elevar el límite de invocaciones para este endpoint serverless de Llama 4 (o indicarnos cómo solicitar un incremento de cuota).

Confirmar si el consumo de este tipo de endpoint sin servidor se cobra contra los créditos gratuitos de Azure o si se factura de forma independiente bajo otro tipo de suscripción/plan.

Quedo atento a cualquier dato adicional que necesiten. ¡Gracias!Descripción del problema:

Recurso afectado: Punto de conexión sin servidor (serverless) de Llama 4 en el Azure Machine Learning workspace “Llama_4”.

Síntoma: Hemos alcanzado el límite configurado de 50 invocaciones, lo que provoca errores de “límite superado” y bloquea nuevas peticiones al modelo.

Impacto: Detiene las pruebas/servicio de inferencia automatizada en nuestros flujos de trabajo actuales.

Petición:

Elevar el límite de invocaciones para este endpoint serverless de Llama 4 (o indicarnos cómo solicitar un incremento de cuota).

Confirmar si el consumo de este tipo de endpoint sin servidor se cobra contra los créditos gratuitos de Azure o si se factura de forma independiente bajo otro tipo de suscripción/plan.

Quedo atento a cualquier dato adicional que necesiten.
¡Gracias!

Compartir a través de

Implementación con API sin servidor (pago por uso) o modelo como servicio (MaaS)

Su respuesta