Gestire e aumentare quote e limiti per le risorse con Azure Machine Learning

Azure usa quote e limiti per evitare sovraccarichi del budget dovuti a frodi e rispettare i vincoli di capacità di Azure. Considerare questi limiti durante la scalabilità per i carichi di lavoro di produzione. Questo articolo contiene informazioni relative agli argomenti seguenti:

  • Limiti predefiniti per le risorse di Azure correlate ad Azure Machine Learning.
  • Creazione di quote a livello di area di lavoro.
  • Visualizzazione delle quote e dei limiti.
  • Richiesta di aumento della quota.

Oltre a gestire quote e limiti, è possibile apprendere come pianificare e gestire i costi per Azure Machine Learning o informazioni sui limiti del servizio in Azure Machine Learning.

Considerazioni speciali

  • Le quote vengono applicate a ogni sottoscrizione nell'account. Se si hanno più sottoscrizioni, è necessario richiedere un aumento della quota per ogni sottoscrizione.

  • Una quota è un limite di credito per le risorse di Azure, non una garanzia di capacità. Se si hanno esigenze di capacità su larga scala, contattare il supporto tecnico di Azure per aumentare la quota.

  • La quota viene condivisa fra tutti i servizi nelle sottoscrizioni, incluso Azure Machine Learning. Calcolare l'utilizzo in tutti i servizi durante la valutazione della capacità.

    Nota

    Il calcolo di Azure Machine Learning è un'eccezione. Ha una quota separata dalla quota di calcolo della memoria centrale.

  • I limiti predefiniti variano in base al tipo di categoria dell'offerta, ad esempio versione di valutazione gratuita, pagamento in base al consumo e serie di macchine virtuali (VM), ad esempio Dv2, F e G.

Quote e limiti predefiniti delle risorse

In questa sezione vengono fornite informazioni sulle quote e sui limiti predefiniti e massimi per le risorse seguenti:

  • Asset di Azure Machine Learning
  • Calcolo di Azure Machine Learning (incluso Spark serverless)
  • Quota condivisa di Azure Machine Learning
  • Endpoint online di Azure Machine Learning (gestiti e Kubernetes) ed endpoint batch
  • Pipeline di Azure Machine Learning
  • Integrazione di Azure Machine Learning con Synapse
  • Macchine virtuali
  • Istanze di Azure Container
  • Archiviazione di Azure

Importante

I limiti sono soggetti a modifiche. Per le informazioni più recenti, vedere Limiti dei servizi in Azure Machine Learning.

Asset di Azure Machine Learning

I limiti seguenti per gli asset si applicano in base all'area di lavoro .

Conto risorse Limite massimo
Set di dati 10 milioni
Esecuzioni 10 milioni
Modelli 10 milioni
Componente 10 milioni
Artifacts 10 milioni

Inoltre, il tempo di esecuzione massimo è di 30 giorni e il numero massimo di metriche registrate per ogni esecuzione è 1 milione.

Ambiente di calcolo di Azure Machine Learning

L'ambiente di calcolo di Azure Machine Learning ha un limite di quota predefinito sia per il numero di core che per il numero di risorse di calcolo univoche consentite per area in una sottoscrizione.

Nota

  • La quota per il numero di core viene suddivisa per ogni famiglia di macchine virtuali e per i core totali cumulativi.
  • La quota per il numero di risorse di calcolo univoche per area è separata dalla quota di core della macchina virtuale, perché si applica solo alle risorse di calcolo gestite di Azure Machine Learning.

Per aumentare i limiti per gli elementi seguenti, richiedere un aumento della quota:

  • Quote di core della famiglia di macchine virtuali. Per altre informazioni sulla famiglia di macchine virtuali per cui richiedere un aumento della quota, vedere Dimensioni delle macchine virtuali in Azure. Ad esempio, le famiglie di macchine virtuali GPU iniziano con "N" nel nome della famiglia ( ad esempio la serie NCv3).
  • Quote di core di sottoscrizione totali
  • Quota cluster
  • Altre risorse in questa sezione

Risorse disponibili:

  • I core dedicati per area hanno un limite predefinito di 24-300, a seconda del tipo di offerta di sottoscrizione. È possibile aumentare il numero di core dedicati per sottoscrizione per ogni famiglia di macchine virtuali. Le famiglie di macchine virtuali specializzate, ad esempio NCv2, NCv3 o serie ND, iniziano con un valore predefinito pari a zero core. Anche le GPU iniziano con un valore predefinito di zero core.

  • I core a priorità bassa per area hanno un limite predefinito di 100-3.000, a seconda del tipo di offerta di sottoscrizione. Il numero di core a bassa priorità per ogni sottoscrizione può essere aumentato ed è un valore singolo per le famiglie di macchine virtuali.

  • Il limite di calcolo totale per area ha un limite predefinito di 500 per area all'interno di una determinata sottoscrizione e può essere aumentato fino a un valore massimo di 2500 per area. Il limite è condiviso tra cluster di training, istanze di calcolo e distribuzioni di endpoint online gestiti. Un'istanza di calcolo viene considerata un cluster a nodo singolo a scopo di quota.

La tabella seguente mostra altri limiti nella piattaforma. Contattare il team del prodotto Azure Machine Learning tramite un ticket di supporto tecnico per richiedere un'eccezione.

Risorsa o azione Limite massimo
Aree di lavoro per gruppo di risorse 800
I nodi in un singolo cluster di calcolo di Azure Machine Learning (AmlCompute) sono configurati come pool non abilitati per la comunicazione( ovvero non possono eseguire processi MPI) 100 nodi ma configurabili fino a 65.000 nodi
I nodi in un singolo passaggio di esecuzione parallela vengono eseguiti in un cluster di calcolo di Azure Machine Learning (AmlCompute) 100 nodi ma configurabili fino a 65.000 nodi se il cluster è configurato per la scalabilità come indicato in precedenza
Nodi in un singolo cluster di calcolo di Azure Machine Learning (AmlCompute) configurato come pool abilitato per la comunicazione 300 nodi ma configurabili fino a 4.000 nodi
Nodi in un singolo cluster di calcolo di Azure Machine Learning (AmlCompute) configurato come pool abilitato per le comunicazioni in una famiglia di macchine virtuali abilitata per RDMA 100 nodi
I nodi in un singolo MPI vengono eseguiti in un cluster di calcolo di Azure Machine Learning (AmlCompute) 100 nodi
Durata dei processi 21 giorni1
Durata del processo in un nodo con priorità bassa 7 giorni2
Server di parametri per nodo 1

1 La durata massima è la durata compresa tra l'avvio di un processo e il termine. I processi completati persistono per un periodo illimitato. I dati per i processi non completati entro la durata massima non sono accessibili.

2 I processi in un nodo con priorità bassa possono essere annullati ogni volta che è presente un vincolo di capacità. È consigliabile implementare checkpoint nel processo.

Quota condivisa di Azure Machine Learning

Azure Machine Learning offre un pool di quote condivise disponibili per utenti diversi in diverse aree da usare contemporaneamente. A seconda della disponibilità, gli utenti possono accedere temporaneamente alla quota dal pool condiviso e usare la quota per eseguire test per un periodo di tempo limitato. La durata specifica dipende dal caso d'uso. Usando temporaneamente la quota dal pool di quote, non è più necessario inviare un ticket di supporto per un aumento della quota a breve termine o attendere l'approvazione della richiesta di quota prima di poter procedere con il carico di lavoro.

L'uso del pool di quote condivise è disponibile per l'esecuzione di processi Spark e per il test dell'inferenza per Llama-2, Phi, Nemotron, Mistral, Dolly e Deci-DeciLM dal Catalogo modelli. È consigliabile usare la quota condivisa solo per la creazione di endpoint di test temporanei, non per gli endpoint di produzione. Per gli endpoint nell'ambiente di produzione, è necessario richiedere una quota dedicata inviando un ticket di supporto. La fatturazione per la quota condivisa è basata sull'utilizzo, proprio come la fatturazione per le famiglie di macchine virtuali dedicate. Per rifiutare esplicitamente la quota condivisa per i processi Spark, compilare questo modulo.

Endpoint e endpoint batch di Azure Machine Learning online

Gli endpoint online di Azure Machine Learning e gli endpoint batch presentano limiti di risorse descritti nella tabella seguente.

Importante

Questi limiti sono a livello di area, ovvero è possibile usare fino a questi limiti per ogni area in uso. Ad esempio, se il limite corrente per il numero di endpoint per sottoscrizione è 100, è possibile creare 100 endpoint nell'area Stati Uniti orientali, 100 endpoint nell'area Stati Uniti occidentali e 100 endpoint in ognuna delle altre aree supportate in una singola sottoscrizione. Lo stesso principio si applica a tutti gli altri limiti.

Per determinare l'utilizzo corrente per un endpoint, visualizzare le metriche.

Per richiedere un'eccezione al team del prodotto Azure Machine Learning, seguire la procedura descritta nell'aumento del limite di endpoint.

Conto risorse   Limite 1                                                 Consente l'eccezione Si applica a
Nome endpoint I nomi degli endpoint devono
  • Iniziare con una lettera
  • Lunghezza di 3-32 caratteri
  • Sono costituiti solo da lettere e numeri 2
  • Per l'endpoint Kubernetes, il nome dell'endpoint e il nome della distribuzione devono avere una lunghezza totale di 3-62 caratteri
  • - Tutti i tipi di endpoint 3
    Nome distribuzione I nomi di distribuzione devono
  • Iniziare con una lettera
  • Lunghezza di 3-32 caratteri
  • Sono costituiti solo da lettere e numeri 2
  • Per l'endpoint Kubernetes, il nome dell'endpoint e il nome della distribuzione devono avere una lunghezza totale di 3-62 caratteri
  • - Tutti i tipi di endpoint 3
    Numero di endpoint per sottoscrizione 100 Tutti i tipi di endpoint 3
    Numero di endpoint per cluster 60 - Endpoint online Kubernetes
    Numero di distribuzioni per sottoscrizione 500 Tutti i tipi di endpoint 3
    Numero di distribuzioni per endpoint 20 Tutti i tipi di endpoint 3
    Numero di distribuzioni per cluster 100 - Endpoint online Kubernetes
    Numero di istanze per distribuzione 50 4 Endpoint online gestito
    Timeout massimo della richiesta a livello di endpoint 180 secondi - Endpoint online gestito
    Timeout massimo della richiesta a livello di endpoint 300 secondi - Endpoint online Kubernetes
    Richieste totali al secondo a livello di endpoint per tutte le distribuzioni 500 5 Endpoint online gestito
    Connessioni totali al secondo a livello di endpoint per tutte le distribuzioni 500 5 Endpoint online gestito
    Totale connessioni attive a livello di endpoint per tutte le distribuzioni 500 5 Endpoint online gestito
    Larghezza di banda totale a livello di endpoint per tutte le distribuzioni 5 MBPS 5 Endpoint online gestito

    1 Questo è un limite regionale. Ad esempio, se il limite corrente per il numero di endpoint è 100, è possibile creare 100 endpoint nell'area Stati Uniti orientali, 100 endpoint nell'area Stati Uniti occidentali e 100 endpoint in ognuna delle altre aree supportate in una singola sottoscrizione. Lo stesso principio si applica a tutti gli altri limiti.

    2 I trattini singoli, ad esempio , my-endpoint-namevengono accettati nei nomi di endpoint e distribuzione.

    3 Gli endpoint e le distribuzioni possono essere di tipi diversi, ma i limiti si applicano alla somma di tutti i tipi. Ad esempio, la somma degli endpoint online gestiti, l'endpoint online e l'endpoint batch di Kubernetes in ogni sottoscrizione non possono superare 100 per area per impostazione predefinita. Analogamente, la somma delle distribuzioni online gestite, le distribuzioni online di Kubernetes e le distribuzioni batch in ogni sottoscrizione non possono superare i 500 per area per impostazione predefinita.

    4 Si riserva il 20% di risorse di calcolo aggiuntive per l'esecuzione degli aggiornamenti. Ad esempio, se si richiedono 10 istanze in una distribuzione, è necessario avere una quota per 12. In caso contrario, viene visualizzato un errore. Esistono alcuni SKU di macchine virtuali esenti da quote aggiuntive. Per altre informazioni, vedere Allocazione della quota di macchine virtuali per la distribuzione .

    5 Le richieste al secondo, le connessioni, la larghezza di banda e così via sono correlate. Se si richiede un aumento per uno di questi limiti, assicurarsi di stimare o calcolare altri limiti correlati insieme.

    Pipeline di Azure Machine Learning

    Le pipeline di Azure Machine Learning hanno i limiti seguenti.

    Conto risorse Limite
    Passaggi in una pipeline 30.000
    Aree di lavoro per gruppo di risorse 800

    Pianificazioni dei processi di Azure Machine Learning

    Le pianificazioni dei processi di Azure Machine Learning hanno i limiti seguenti.

    Conto risorse Limite
    Pianificazioni per area 100

    Integrazione di Azure Machine Learning con Synapse

    Spark serverless di Azure Machine Learning consente di accedere facilmente alla funzionalità di elaborazione distribuita per il ridimensionamento dei processi Apache Spark. Spark serverless usa la stessa quota dedicata dell'ambiente di calcolo di Azure Machine Learning. I limiti di quota possono essere aumentati inviando un ticket di supporto e richiedendo un aumento della quota e del limite per la serie ESv3 nella categoria "Servizio Machine Learning: Quota macchina virtuale".

    Per visualizzare l'utilizzo delle quote, passare a Machine Learning Studio e selezionare il nome della sottoscrizione per cui si vuole visualizzare l'utilizzo. Selezionare "Quota" nel pannello sinistro.

    Screenshot delle quote di Azure Machine Learning.

    Macchine virtuali

    Ogni sottoscrizione di Azure ha un limite al numero di macchine virtuali in tutti i servizi. I core delle macchine virtuali hanno un limite totale a livello di area e un limite a livello di area per serie di dimensioni. Entrambi i limiti vengono applicati separatamente.

    Si consideri ad esempio una sottoscrizione con limite di core di VM totale per gli Stati Uniti orientali pari a 30, un limite di core di serie A pari a 30 e un limite di core di serie D pari a 30. Questa sottoscrizione può distribuire 30 MACCHINE virtuali A1 o 30 D1 o una combinazione dei due che non supera un totale di 30 core.

    Non è possibile aumentare i limiti per le macchine virtuali sopra i valori illustrati nella tabella seguente.

    Conto risorse Limite
    Sottoscrizioni di Azure associate a un tenant di Microsoft Entra Nessun limite
    Coamministratori per ogni sottoscrizione Nessun limite
    Gruppi di risorse per sottoscrizione 980
    Dimensione delle richieste delle API di Azure Resource Manager 4.194.304 byte
    Tag per sottoscrizione1 50
    Calcoli di tag univoci per sottoscrizione2 80.000
    Distribuzioni a livello di sottoscrizione per sede 8003
    Percorsi delle distribuzioni a livello di sottoscrizione 10

    1È possibile applicare fino a 50 tag direttamente a una sottoscrizione. All'interno della sottoscrizione, ogni risorsa o gruppo di risorse è limitato a 50 tag. Tuttavia, la sottoscrizione può contenere un numero illimitato di tag distribuiti tra risorse e gruppi di risorse.

    2Resource Manager restituisce un elenco di valori e nome di tag nella sottoscrizione solo quando il numero di tag univoci è 80.000 o inferiore. Un tag univoco viene definito dalla combinazione di ID risorsa, nome tag e valore del tag. Ad esempio, due risorse con lo stesso nome di tag e valore vengono calcolate come due tag univoci. È comunque possibile trovare una risorsa per tag quando il numero supera 80.000.

    3Le distribuzioni vengono eliminate automaticamente dalla cronologia quando si avvicina il limite. Per alter informazioni, vedere Eliminazioni automatiche dalla cronologia delle distribuzioni.

    Istanze di Container

    Per altre informazioni, vedere limiti Istanze di Container.

    Storage

    Archiviazione di Azure ha un limite di 250 account di archiviazione per area, per sottoscrizione. Questo limite include sia gli account di archiviazione Standard che Premium.

    Quote a livello di area di lavoro

    Usare le quote a livello di area di lavoro per gestire l'allocazione di calcolo di destinazione di Azure Machine Learning tra più aree di lavoro nella stessa sottoscrizione.

    Per impostazione predefinita, tutte le aree di lavoro condividono la stessa quota a livello di sottoscrizione per le famiglie di macchine virtuali. Tuttavia, è possibile impostare una quota massima per le singole famiglie di macchine virtuali nelle aree di lavoro di una sottoscrizione. Le quote per le singole famiglie di macchine virtuali permettono di condividere la capacità ed evitare problemi di contesa delle risorse.

    1. Passare a un'area di lavoro nella sottoscrizione.
    2. Nel riquadro a sinistra selezionare Utilizzo e quote.
    3. Selezionare la scheda Configura quote per visualizzare le quote.
    4. Espandere una famiglia di macchine virtuali.
    5. Impostare un limite di quota per una qualsiasi area di lavoro elencata nella famiglia di macchine virtuali.

    Non è possibile impostare un valore negativo o un valore superiore a quello della quota a livello di sottoscrizione.

    Screenshot che mostra una quota a livello dell'area di lavoro di Azure Machine Learning.

    Nota

    È necessario avere le autorizzazioni a livello di sottoscrizione per impostare la quota a livello dell'area di lavoro.

    Visualizzare le quote in Studio

    1. Quando si crea una nuova risorsa di calcolo, per impostazione predefinita vengono visualizzate solo le dimensioni delle macchine virtuali che si dispone già della quota da usare. Impostare la visualizzazione su Seleziona da tutte le opzioni.

      Screenshot che mostra la selezione di tutte le opzioni per visualizzare le risorse di calcolo che richiedono una quota maggiore

    2. Scorrere verso il basso fino a visualizzare l'elenco delle dimensioni delle macchine virtuali per cui non si dispone della quota.

      Screenshot che mostra l'elenco della quota zero

    3. Usare il collegamento per passare direttamente alla richiesta di assistenza clienti online per ottenere una quota maggiore.

    Visualizzare l'utilizzo e le quote nel portale di Azure

    Per visualizzare la quota per varie risorse di Azure, ad esempio macchine virtuali, archiviazione o rete, usare il portale di Azure:

    1. Nel riquadro sinistro selezionare Tutti i servizi e quindi Sottoscrizioninella categoria Generale.

    2. Nell'elenco delle sottoscrizioni selezionare la sottoscrizione di cui si sta cercando la quota.

    3. Selezionare Utilizzo e quote per visualizzare i limiti e l'utilizzo correnti delle quote . Usare i filtri per selezionare il provider e le posizioni.

    È possibile gestire la quota di calcolo di Azure Machine Learning nella sottoscrizione separatamente dalle altre quote di Azure:

    1. Passare all'area di lavoro di Azure Machine Learning nella portale di Azure.

    2. Nel riquadro sinistro, nella sezione Supporto e risoluzione dei problemi selezionare Utilizzo e quote per visualizzare i limiti e l'utilizzo correnti delle quote .

    Screenshot della visualizzazione del portale di Azure dei limiti e dell'utilizzo correnti delle quote.

    1. Selezionare una sottoscrizione per visualizzare i limiti di quota. Filtrare in base all'area a cui si è interessati.

    2. È possibile passare da una visualizzazione a livello di sottoscrizione a una vista a livello di area di lavoro.

    Richiesta di aumento quota e limite

    L'aumento della quota delle macchine virtuali consiste nell'aumentare il numero di core per famiglia di macchine virtuali per regione. L'aumento del limite dell'endpoint consiste nell'aumentare i limiti specifici degli endpoint per sottoscrizione e regione. Fare attenzione a scegliere la categoria giusta quando si presenta la richiesta di aumento della quota, come descritto nella sezione successiva.

    Aumento della quota di macchine virtuali

    Per aumentare il limite per la quota di macchine virtuali di Azure Machine Learning al di sopra del limite predefinito, è possibile richiedere l'aumento della quota dalla vista Utilizzo e quote precedenti o inviare una richiesta di aumento della quota da studio di Azure Machine Learning.

    1. Andare sulla pagina Utilizzo + Quota seguendo le istruzioni riportate qui sopra. Visualizzare i limiti di quota attuali. Selezionare lo SKU per il quale si desidera richiedere un aumento.

    Screenshot dei dettagli di quota delle macchine virtuali.

    1. Specificare la quota da aumentare e il nuovo valore limite. Infine, selezionare Invia per continuare.

    Screenshot del nuovo modulo di richiesta di quota delle macchine virtuali.

    Aumento del limite di endpoint

    Per aumentare il limite di endpoint, aprire una richiesta di assistenza online. Quando si richiede l'aumento del limite dell'endpoint, specificare le informazioni seguenti:

    1. Quando si apre la richiesta di supporto, selezionare Limiti di servizio e sottoscrizione (quote) come tipo di problema.
    2. Selezionare la sottoscrizione scelta.
    3. Selezionare Servizio Machine Learning: limiti degli endpoint come tipo di quota.
    4. Nella scheda Dettagli aggiuntivi è necessario specificare in dettaglio i motivi per l'aumento del limite affinché la richiesta venga elaborata. Selezionare Immetti dettagli e quindi specificare il limite da aumentare e il nuovo valore, il motivo della richiesta di aumento del limite e le posizioni in cui è necessario intervenire. Assicurarsi di aggiungere le informazioni seguenti nel motivo dell'aumento del limite:
      1. Descrizione dello scenario e del carico di lavoro ( come ad esempio testo, immagine e così via).
      2. Motivazione dell'aumento richiesto.
        1. Fornire la velocità di trasmissione effettiva di destinazione e il relativo modello (QPS medio/picco, utenti simultanei).
        2. Specificare la latenza di destinazione su larga scala e la latenza corrente osservata con una singola istanza.
        3. Specificare l'SKU della macchina virtuale e il numero totale di istanze per supportare la velocità di trasmissione effettiva e la latenza di destinazione. Specificare il numero di endpoint/distribuzioni/istanze che si prevede di usare in ogni area.
        4. Verificare se si dispone di un test di benchmark che indica l'SKU della macchina virtuale selezionato e il numero di istanze che soddisfa i requisiti di velocità di trasmissione effettiva e di latenza.
        5. Specificare il tipo di payload e le dimensioni di un singolo payload. La larghezza di banda di rete deve essere allineata alle dimensioni del payload e alle richieste al secondo.
        6. Specificare un piano di tempo pianificato (quando sono necessari limiti maggiori: fornire un piano a fasi, se possibile) e verificare (1) se il costo di esecuzione su tale scala si riflette nel budget e (2) se gli SKU delle macchine virtuali di destinazione sono approvati.
    5. Infine, selezionare Salva e continua per continuare.

    Screenshot del modulo dei dettagli sul limite degli endpoint.

    Nota

    Questa richiesta di aumento del limite degli endpoint è diversa dalla richiesta di aumento della quota delle macchine virtuali. Se la richiesta è correlata all'aumento della quota delle macchine virtuali, seguire le istruzioni nella sezione relativa agli aumenti di quota delle macchine virtuali.

    Aumento del limite di calcolo

    Per aumentare il limite di calcolo totale, aprire una richiesta di assistenza online. Specificare le informazioni seguenti:

    1. Quando si apre la richiesta di supporto, selezionare Tecnico come tipo di problema.

    2. Selezionare il nome della sottoscrizione scelta

    3. Selezionare il servizio Machine Learning come Servizio.

    4. Selezionare la risorsa desiderata

    5. Nel riepilogo, menzionare "Aumentare i limiti di calcolo totali"

    6. Selezionare Cluster di elaborazione come tipo di problema e Cluster non aumenta o si blocca durante il ridimensionamento come sottotipo di Problema.

      Screenshot della scheda di descrizione del problema.

    7. Nella scheda Dettagli aggiuntivi specificare l'ID sottoscrizione, l'area, il nuovo limite (compreso tra 500 e 2500) e la giustificazione aziendale, se si desidera aumentare i limiti di calcolo totali in questa area.

      Screenshot della scheda dei dettagli aggiuntivi.

    8. Infine, selezionare Crea per creare un ticket di richiesta di supporto.

    Passaggi successivi