Implementación con API sin servidor (pago por uso) o modelo como servicio (MaaS)

Borja Hoyos 0 Puntos de reputación
2025-05-30T10:20:07.3733333+00:00

Descripción del problema:

  • Recurso afectado: Punto de conexión sin servidor (serverless) de Llama 4 en el Azure Machine Learning workspace “Llama_4”.

Síntoma: Hemos alcanzado el límite configurado de 50 invocaciones, lo que provoca errores de “límite superado” y bloquea nuevas peticiones al modelo.

Impacto: Detiene las pruebas/servicio de inferencia automatizada en nuestros flujos de trabajo actuales.

Petición:

Elevar el límite de invocaciones para este endpoint serverless de Llama 4 (o indicarnos cómo solicitar un incremento de cuota).

Confirmar si el consumo de este tipo de endpoint sin servidor se cobra contra los créditos gratuitos de Azure o si se factura de forma independiente bajo otro tipo de suscripción/plan.

Quedo atento a cualquier dato adicional que necesiten. ¡Gracias!Descripción del problema:

Recurso afectado: Punto de conexión sin servidor (serverless) de Llama 4 en el Azure Machine Learning workspace “Llama_4”.

Síntoma: Hemos alcanzado el límite configurado de 50 invocaciones, lo que provoca errores de “límite superado” y bloquea nuevas peticiones al modelo.

Impacto: Detiene las pruebas/servicio de inferencia automatizada en nuestros flujos de trabajo actuales.

Petición:

Elevar el límite de invocaciones para este endpoint serverless de Llama 4 (o indicarnos cómo solicitar un incremento de cuota).

Confirmar si el consumo de este tipo de endpoint sin servidor se cobra contra los créditos gratuitos de Azure o si se factura de forma independiente bajo otro tipo de suscripción/plan.

Quedo atento a cualquier dato adicional que necesiten.
¡Gracias!

Centro de la comunidad | Sin supervisar
0 comentarios No hay comentarios
{count} votos

Su respuesta

Las respuestas se pueden marcar como respuestas aceptadas por el autor de la pregunta, lo que ayuda a los usuarios a conocer la respuesta que resolvió el problema del autor.