Administración y aumento de cuotas y límites para recursos con Azure Machine Learning

Azure usa límites y cuotas para evitar sobrecostos presupuestarios por fraude y para respetar las restricciones de capacidad de Azure. Tenga en cuenta estos límites a medida que escala para cargas de trabajo de producción. En este artículo, aprenderá lo siguiente:

  • Límites predeterminados de los recursos de Azure relacionados con Azure Machine Learning.
  • Creación de cuotas de nivel de área de trabajo.
  • Visualización de las cuotas y los límites.
  • Solicitud de aumentos de cuota.

Además de administrar cuotas y límites, puede obtener información sobre cómo planificar y administrar los costos de Azure Machine Learning o sobre los límites de servicio en Azure Machine Learning.

Consideraciones especiales

  • Las cuotas se aplican a cada suscripción de la cuenta. Si tiene varias suscripciones, debe solicitar un aumento de cuota para cada suscripción.

  • Una cuota es un límite de crédito en los recursos de Azure, no una garantía de capacidad. Si tiene necesidades de capacidad a gran escala, póngase en contacto con el soporte técnico de Azure para incrementar la cuota.

  • Una cuota se comparte entre todos los servicios de las suscripciones, incluido Azure Machine Learning. Calcule el uso en todos los servicios al evaluar la capacidad.

    Nota:

    El proceso de Azure Machine Learning es una excepción. Tiene una cuota independiente de la cuota de proceso base.

  • Los límites predeterminados varían según el tipo de categoría de la oferta; por ejemplo, evaluación gratuita, pago por uso, y la serie de la máquina virtual (VM), como Dv2, F y G.

Límites y cuotas de recursos predeterminados

En esta sección, obtendrá información sobre los límites y cuotas predeterminados y máximos para los siguientes recursos:

  • Recursos de Azure Machine Learning
  • Procesos de Azure Machine Learning (incluido Spark sin servidor)
  • Cuota compartida de Azure Machine Learning
  • Puntos de conexión en línea de Azure Machine Learning (administrados y de Kubernetes) y puntos de conexión por lotes
  • Canalizaciones de Azure Machine Learning
  • Integración de Azure Machine Learning con Synapse
  • Máquinas virtuales
  • Azure Container Instances
  • Azure Storage

Importante

Los límites están sujetos a cambios. Para obtener la información más reciente, consulte Límites de servicio en Azure Machine Learning.

Recursos de Azure Machine Learning

En cada área de trabajo se aplican los límites siguientes a los recursos.

Recurso Límite máximo
Conjuntos de datos 10 millones
Ejecuciones 10 millones
Modelos 10 millones
Componente 10 millones
Artifacts 10 millones

Además, el tiempo de ejecución máximo es de 30 días y el número máximo de métricas registradas por ejecución es de 1 millón.

Proceso de Azure Machine Learning

El proceso de Azure Machine Learning tiene un límite de cuota predeterminado sobre el número de núcleos y sobre el número de recursos de proceso únicos permitidos por región en una suscripción.

Nota:

  • La cuota del número de núcleos se divide por cada familia de máquinas virtuales y los núcleos totales acumulados.
  • La cuota del número de recursos de proceso únicos por región es independiente de la cuota de núcleos de VM, ya que solo se aplica a los recursos de proceso administrados de Azure Machine Learning.

Para aumentar los límites de los siguientes elementos, solicite un aumento de cuota:

  • Cuotas de núcleos de la familia de VM. Para obtener más información sobre la familia de máquinas virtuales para la que se va a solicitar un aumento de cuota, consulte Tamaños de las máquinas virtuales en Azure. Por ejemplo, las familias de máquinas virtuales de GPU tienen una "N" al principio de su nombre de familia (como la serie NCv3).
  • Cuota de núcleos total de la suscripción
  • Cuota de clúster
  • Otros recursos de esta sección

Recursos disponibles:

  • Los núcleos dedicados por región tienen un límite predeterminado de 24 a 300, según el tipo de oferta de la suscripción. Es posible aumentar el número de núcleos dedicados por suscripción de cada familia de máquinas virtuales. Las familias de máquinas virtuales especializadas, como las series NCv2, NCv3 o ND, comienzan con un valor predeterminado de cero núcleos. Las GPU también se establecen en cero núcleos de manera predeterminada.

  • Los núcleos de prioridad baja por región tienen un límite predeterminado de 100 a 3000, según el tipo de oferta de la suscripción. El número de núcleos de baja prioridad por suscripción se puede aumentar y es un valor único en todas las familias de máquinas virtuales.

  • Límite total de proceso por región tiene un límite predeterminado de 500 por región dentro de una suscripción determinada y puede aumentarse hasta un valor máximo de 2500 por región. Este límite se comparte entre los clústeres de entrenamiento, las instancias de proceso y las implementaciones de puntos de conexión administrados en línea. Una instancia de proceso se considera un clúster de un solo nodo para los fines de la cuota.

En la tabla siguiente se muestran más límites en la plataforma. Póngase en contacto con el equipo del producto de Azure Machine Learning por medio de una incidencia de soporte técnico para solicitar una excepción.

Recurso o acción Límite máximo
Número de áreas de trabajo por grupo de recursos 800
Nodos de una única configuración de clúster de Proceso de Azure Machine Learning (AmlCompute) como un grupo no habilitado para la comunicación (es decir, que no puede ejecutar trabajos de MPI). 100 nodos, pero configurable hasta 65,000 nodos.
Nodos en un único paso de ejecución paralelo se ejecutan en un clúster de Proceso de Azure Machine Learning (AmlCompute) 100 nodos, pero configurable hasta 65 000 nodos si el clúster está configurado para el escalado, tal como se mencionó antes.
Nodos de una única configuración de clúster del Proceso de Azure Machine Learning (AmlCompute) como un grupo habilitado para la comunicación 300 nodos, pero configurable hasta 4000 nodos
Nodos de una única configuración de clúster del Proceso de Azure Machine Learning (AmlCompute) como un grupo habilitado para la comunicación en una familia de máquinas virtuales habilitada para RDMA 100 nodos
Los nodos en una única interfaz de paso de mensajes se ejecutan en un clúster del Proceso de Azure Machine Learning (AmlCompute) 100 nodos
Vigencia del trabajo 21 días1
Vigencia del trabajo en un nodo de prioridad baja 7 días2
Número de servidores de parámetro por nodo 1

1 La vigencia máxima es la duración entre el inicio y la finalización de un trabajo. Los trabajos completados se mantienen de forma indefinida. Los datos de los trabajos no completados en la duración máxima no son accesibles.

2 Los trabajos en un nodo de prioridad baja pueden adelantarse siempre que haya una restricción de capacidad. Se recomienda implementar puntos de comprobación en el trabajo.

Cuota compartida de Azure Machine Learning

Azure Machine Learning proporciona un grupo de cuotas compartidas que está disponible para que diferentes usuarios de varias regiones la utilicen simultáneamente. En función de la disponibilidad, los usuarios pueden acceder temporalmente a la cuota del grupo compartido y usar la cuota para realizar pruebas durante un período de tiempo limitado. La duración específica depende del caso de uso. Al usar temporalmente la cuota del grupo de cuotas, ya no es necesario presentar una incidencia de soporte técnico para solicitar un aumento de la cuota a corto plazo ni esperar a que se apruebe la solicitud de cuota para poder continuar con la carga de trabajo.

El uso del grupo de cuotas compartido está disponible para ejecutar trabajos de Spark y para probar la inferencia para llama-2, Phi, Nemotron, Mistral, Dolly y Deci-Deci-DeciLM desde el catálogo de modelos. Solo debe usar la cuota compartida para crear puntos de conexión de prueba temporales, no para puntos de conexión de producción. Para los puntos de conexión de producción, debe solicitar cuota dedicada mediante la presentación de una incidencia de soporte técnico. La facturación de la cuota compartida se basa en el uso, al igual que la facturación de las familias de máquinas virtuales dedicadas. Para no participar en la cuota compartida para los trabajos de Spark, rellene este formulario.

Puntos de conexión en línea de Azure Machine Learning y puntos de conexión por lotes

Los puntos de conexión en línea de Azure Machine Learning y los puntos de conexión por lotes tienen los límites que se describen en la tabla siguiente.

Importante

Estos son límites regionales, lo que significa que su uso depende de estos límites por cada región que use. Por ejemplo, si el límite actual para el número de puntos de conexión por suscripción es 100, puede crear 100 puntos de conexión en la región Este de EE. UU., 100 puntos de conexión en la región Oeste de EE. UU. y 100 puntos de conexión en cada una de las demás regiones admitidas en una sola suscripción. El mismo principio se aplica a los demás límites.

Para determinar el uso actual de un punto de conexión, consulte las métricas.

Para solicitar una excepción del equipo del producto de Azure Machine Learning, use los pasos de Solicitud de aumentos de punto de conexión.

Recurso   Límite 1                                                 Permite una excepción Se aplica a
El nombre del punto de conexión Los nombres de los puntos de conexión deben
  • Empezar con una letra
  • Tener entre 3 y 32 caracteres de longitud
  • Consistir solo en letras y números 2
  • - Todos los tipos de punto de conexión 3
    Nombre de implementación Los nombres de implementación deben
  • Empezar con una letra
  • Tener entre 3 y 32 caracteres de longitud
  • Consistir solo en letras y números 2
  • - Todos los tipos de punto de conexión 3
    Número de puntos de conexión por suscripción 100 Todos los tipos de punto de conexión 3
    Número de puntos de conexión por clúster 60 - Punto de conexión en línea de Kubernetes
    Número de implementaciones por suscripción 500 Todos los tipos de punto de conexión 3
    Número de implementaciones por punto de conexión 20 Todos los tipos de punto de conexión 3
    Número de implementaciones por clúster 100 - Punto de conexión en línea de Kubernetes
    Número de instancias por implementación 50 4 Punto de conexión en línea administrado
    Tiempo de espera máximo de la solicitud en el nivel de punto de conexión 180 Segundos - Punto de conexión en línea administrado
    Tiempo de espera máximo de la solicitud en el nivel de punto de conexión 300 segundos - Punto de conexión en línea de Kubernetes
    Total de solicitudes por segundo a nivel de punto de conexión para todas las implementaciones 500 5 Punto de conexión en línea administrado
    Total de conexiones por segundo a nivel de punto de conexión para todas las implementaciones 500 5 Punto de conexión en línea administrado
    Total de conexiones activas a nivel de punto de conexión para todas las implementaciones 500 5 Punto de conexión en línea administrado
    Total de ancho de banda a nivel de punto de conexión para todas las implementaciones 5 MBPS 5 Punto de conexión en línea administrado

    1 Se trata de un límite regional. Por ejemplo, si el límite actual de puntos de conexión es 100, puede crear 100 puntos de conexión en la región Este de EE. UU., 100 puntos de conexión en la región Oeste de EE. UU. y 100 puntos de conexión en cada una de las demás regiones admitidas en una sola suscripción. El mismo principio se aplica a los demás límites.

    2 Los guiones simples, como my-endpoint-name, se aceptan en los nombres de punto de conexión e implementación.

    3 Los puntos de conexión y las implementaciones pueden ser de tipos diferentes, pero los límites se aplican a la suma de todos los tipos. Por ejemplo, la suma de los punto de conexión en línea administrados, el punto de conexión en línea de Kubernetes y el punto de conexión por lotes en cada suscripción no puede superar los 100 de manera predeterminada. Del mismo modo, la suma de las implementaciones en línea administradas, las implementaciones en línea de Kubernetes y las implementaciones por lotes en cada suscripción no pueden superar las 500.

    4 Reservamos un 20 % de recursos de proceso adicionales para realizar actualizaciones. Por ejemplo, si solicita 10 instancias en una implementación, debe tener una cuota para 12. De lo contrario, recibe un error. Hay algunas SKU de máquina virtual que están exentas de la cuota adicional. Vea Asignación de la cuota de máquina virtual para la implementación para más información.

    5 Las solicitudes por segundo, las conexiones, el ancho de banda, etc., están relacionados. Si solicita un aumento de cualquiera de estos límites, asegúrese de estimar o calcular otros límites relacionados de forma conjunta.

    Canalizaciones de Azure Machine Learning

    Las canalizaciones de Azure Machine Learning tienen los siguientes límites.

    Recurso Límite
    Pasos en una canalización 30,000
    Número de áreas de trabajo por grupo de recursos 800

    Programaciones del trabajo de Azure Machine Learning

    Las programaciones del trabajo de Azure Machine Learning tienen los siguientes límites.

    Recurso Límite
    Programaciones por región 100

    Integración de Azure Machine Learning con Synapse

    Spark sin servidor de Azure Machine Learning proporciona un acceso sencillo a la funcionalidad de computación distribuida para escalar trabajos de Apache Spark. La instancia de Spark sin servidor usa la misma cuota dedicada que el Proceso de Azure Machine Learning. Los límites de cuota se puede aumentar mediante el envío de una incidencia de soporte técnico y la solicitud de un aumento de cuota para la serie ESV3 en la categoría "Servicio Machine Learning: cuota de máquina virtual".

    Para ver el uso de cuotas, vaya a Machine Learning Studio y seleccione el nombre de la suscripción para la que desea ver el uso. Seleccione "Cuota" en el panel de la izquierda.

    Screenshot of the Azure Machine Learning quotas.

    Máquinas virtuales

    Cada suscripción de Azure tiene un límite en el número de máquinas virtuales que pueden tenerse entre todos los servicios. Los núcleos de las máquinas virtuales tienen un límite regional total y un límite regional por serie de tamaño. Ambos límites se aplican por separado.

    Por ejemplo, considere una suscripción con un límite total de núcleos de máquinas virtuales de Este de EE. UU. de 30, un límite de núcleos de serie A de 30 y un límite de núcleos de serie D de 30. Esta suscripción podría volver a implementar 30 máquinas virtuales A1, 30 máquinas virtuales D1 o una combinación de las dos que no superen los 30 núcleos.

    No se pueden aumentar los límites de las máquinas virtuales por encima de los valores que se muestran en la siguiente tabla.

    Recurso Límite
    Suscripciones de Azure asociadas a un inquilino de Microsoft Entra Sin límite
    Coadministradores por suscripción Sin límite
    Grupos de recursos por suscripción 980
    Tamaño de solicitud de API de Azure Resource Manager 4 194 304 bytes
    Etiquetas por suscripción1 50
    Cálculos de etiquetas únicas por suscripción2 80 000
    Implementaciones de nivel de suscripción por ubicación 8003
    Ubicaciones de las implementaciones en el nivel de suscripción 10

    1Puede aplicar hasta 50 etiquetas directamente a una suscripción. Dentro de la suscripción, cada recurso o grupo de recursos también se limita a 50 etiquetas. Sin embargo, la suscripción puede contener un número ilimitado de etiquetas dispersas entre recursos y grupos de recursos.

    2Resource Manager devuelve una lista de nombres y valores de etiquetas en la suscripción solo cuando la cantidad de etiquetas únicas es 80 000 o menos. Una etiqueta única se define mediante la combinación de identificador de recurso, nombre de etiqueta y valor de etiqueta. Por ejemplo, dos recursos con el mismo nombre de etiqueta y valor se calcularían como dos etiquetas únicas. Sin embargo, aunque haya más, es posible encontrar un recurso por etiqueta.

    3Las implementaciones se eliminan automáticamente del historial a medida se aproxima al límite. Para obtener más información, consulte Eliminaciones automáticas del historial de implementaciones.

    Azure Container Instances

    Para más información, consulte Límites de Container Instances.

    Storage

    Azure Storage tiene un límite de 250 cuentas de almacenamiento por región y suscripción. Este límite incluye las cuentas de almacenamiento Estándar y Premium.

    Cuotas de nivel de área de trabajo

    Use las cuotas de nivel de área de trabajo para administrar la asignación de destino de proceso de Azure Machine Learning entre varias áreas de trabajo de la misma suscripción.

    De manera predeterminada, todas las áreas de trabajo comparten la misma cuota que la cuota de nivel de suscripción de las familias de máquinas virtuales. Sin embargo, puede establecer una cuota máxima para familias de máquinas virtuales individuales en áreas de trabajo de una suscripción. Las cuotas de las familias de máquinas virtuales individuales permiten compartir capacidades y evitar problemas de contención de recursos.

    1. Vaya a cualquier área de trabajo de la suscripción.
    2. En el panel izquierdo, seleccione Uso y cuotas.
    3. Seleccione la pestaña Configurar cuotas para ver las cuotas.
    4. Expanda una familia de máquinas virtuales.
    5. Establezca un límite de cuota en cualquier área de trabajo que aparezca en esa familia de máquinas virtuales.

    No se puede establecer un valor negativo ni un valor superior a la cuota de nivel de suscripción.

    Screenshot that shows an Azure Machine Learning workspace-level quota.

    Nota:

    Se necesitan permisos de nivel de suscripción para establecer una cuota en el nivel de área de trabajo.

    Visualización de cuotas en Studio

    1. Al crear un recurso de proceso, de manera predeterminada, ve solo los tamaños de VM que ya tiene cuota que usar. Cambie la vista a Seleccionar de todas las opciones.

      Screenshot shows select all options to see compute resources that need more quota

    2. Desplácese hacia abajo hasta que vea la lista de tamaños de VM para los que no tiene cuota.

      Screenshot shows list of zero quota

    3. Use el vínculo para ir directamente a la solicitud de soporte técnico al cliente en línea para obtener más cuota.

    Visualización del uso y las cuotas en Azure Portal

    Para ver la cuota de diversos recursos de Azure, como máquinas virtuales, almacenamiento o red, use Azure Portal:

    1. En el panel izquierdo seleccione Todos los servicios y luego Suscripciones en la categoría General.

    2. En la lista de suscripciones seleccione la suscripción cuya cuota busca.

    3. Seleccione Uso y cuotas para ver los límites y el uso actuales de la cuota. Use los filtros para seleccionar el proveedor y las ubicaciones.

    La cuota de proceso de Azure Machine Learning de la suscripción se administra de forma independiente de otras cuotas de Azure:

    1. Vaya al área de trabajo de Azure Machine Learning en Azure Portal.

    2. En el panel izquierdo, en la sección Soporte técnico y solución de problemas, seleccione Uso y cuotas para ver el uso y los límites de cuota actuales.

    Screenshot of Azure Portal view of current quota limits and usage.

    1. Seleccione una suscripción para ver los límites de cuota. Filtre por la región que le interesa.

    2. Puede alternar entre una vista de nivel de suscripción y una de nivel de área de trabajo.

    Solicitud de aumentos de cuota y límite

    El aumento de la cuota de máquina virtual consiste en incrementar el número de núcleos por familia de máquina virtual por región. El aumento del límite de puntos de conexión consiste en incrementar los límites específicos de punto de conexión por suscripción por región. Asegúrese de elegir la categoría correcta al enviar la solicitud de aumento de cuota, como se describe en la sección siguiente.

    Aumentos de cuota de máquina virtual

    Para aumentar el límite de la cuota de máquinas virtuales de Azure Machine Learning por encima del límite predeterminado, puede solicitar el aumento de cuota desde la vista Uso y cuotas anterior o enviar una solicitud de aumento de cuota desde el Estudio de Azure Machine Learning.

    1. Vaya a la página Uso y cuotas siguiendo las instrucciones anteriores. Ver los límites de cuota actuales. Seleccione la SKU para la que desea solicitar un aumento.

    Screenshot of the VM quota details.

    1. Proporcione la cuota que desea aumentar y el nuevo valor de límite. Por último, seleccione Enviar para continuar.

    Screenshot of the new VM quota request form.

    Aumento de límites de punto de conexión

    Para aumentar el límite de puntos de conexión, abra una solicitud de soporte técnico al cliente en línea. Al solicitar el aumento del límite de puntos de conexión, proporcione la información siguiente:

    1. Al abrir la solicitud de soporte técnico, seleccione Límites de servicio y suscripción (cuotas) como el tipo de incidencia.
    2. Seleccione la suscripción que prefiera.
    3. Seleccione Machine Learning Service: límites de punto de conexión como Tipo de cuota.
    4. En la pestaña Detalles adicionales, debe proporcionar razones detalladas para el aumento del límite a fin de que se procese la solicitud. Seleccione Escribir detalles y, después, especifique el límite que quiere aumentar y el valor nuevo de cada límite, el motivo de la solicitud de aumento del límite y las ubicaciones en las que lo necesite. Asegúrese de agregar la información siguiente al motivo del aumento del límite:
      1. Descripción del escenario y la carga de trabajo (como texto, imagen, etc.).
      2. Justificación del aumento solicitado.
        1. Proporcione el rendimiento de destino y su patrón (QPS promedio/pico, usuarios simultáneos).
        2. Proporcione la latencia de destino a gran escala y la latencia actual que observe con una sola instancia.
        3. Proporcione la SKU de máquina virtual y el número de instancias en total para admitir el rendimiento y la latencia de destino. Proporcione el número de puntos de conexión, implementaciones o instancias que planea usar en cada región.
        4. Confirme si tiene un punto de referencia que indica la SKU de máquina virtual seleccionada y el número de instancias que cumplirían los requisitos de rendimiento y latencia.
        5. Proporcione el tipo de carga y el tamaño de una sola carga. El ancho de banda de red debe alinearse con el tamaño de carga y las solicitudes por segundo.
        6. Proporcione un plan de tiempo (cuando necesite aumentar los límites: proporcione un plan preconfigurado si es posible) y confirme si (1) el costo de ejecutarlo a esa escala se refleja en el presupuesto y (2) se aprueban las SKU de máquina virtual de destino.
    5. Por último, seleccione Guardar y continuar para continuar.

    Screenshot of the endpoint limit details form.

    Nota:

    Esta solicitud de aumento del límite de puntos de conexión es diferente de la solicitud de aumento de cuota de máquina virtual. Si la solicitud está relacionada con el aumento de la cuota de máquina virtual, siga las instrucciones de la sección Aumentos de cuota de máquina virtual.

    Aumento de límites de proceso

    Para aumentar el límite total de proceso, abra una solicitud de soporte técnico al cliente en línea. Proporcione la siguiente información:

    1. Al abrir la solicitud de soporte técnico, seleccione Técnica como Tipo de incidencia.

    2. Seleccione la suscripción que prefiera.

    3. Seleccione Machine Learning como Servicio.

    4. Seleccione el recurso que prefiera

    5. En el resumen, mencione "Aumentar los límites totales de proceso"

    6. Seleccione Clúster de proceso como Tipo de problema y Clúster no se escala verticalmente o está bloqueado al cambiar el tamaño como Subtipo de problema.

      Screenshot of the problem description tab.

    7. En la pestaña Detalles adicionales, proporcione el Id. de suscripción, la región, el nuevo límite (entre 500 y 2500) y la justificación comercial si desea aumentar los límites de proceso totales en esta región.

      Screenshot of the additional details tab.

    8. Por último, seleccione Crear para crear una incidencia de solicitud de soporte técnico.

    Pasos siguientes