Dimensioni delle macchine virtuali High Performance Computing

Si applica a: ✔️ Macchine ✔️ virtuali Linux Macchine virtuali ✔️ Windows Set di scalabilità flessibili Set di scalabilità ✔️ Uniform

Suggerimento

Provare lo strumento selettore macchine virtuali per trovare altre dimensioni che soddisfano meglio il carico di lavoro.

Le macchine virtuali serie H di Azure sono progettate per offrire prestazioni, scalabilità e efficienza dei costi per vari carichi di lavoro HPC reali.

Serie HBv3 Le macchine virtuali sono ottimizzate per applicazioni HPC, ad esempio la dinamica fluida, l'analisi esplicita e implicita degli elementi finiti, la modellazione meteo, l'elaborazione sismica, la simulazione del serbatoio e la simulazione RTL. Le macchine virtuali HBv3 presentano fino a 120 core CPU AMD EPYC™ 7003 serie (Milano), 448 GB di RAM e nessun hyperthreading. Le macchine virtuali serie HBv3 offrono anche 350 GB/sec di larghezza di banda di memoria, fino a 32 MB di cache L3 per core, fino a 7 GB/s di prestazioni SSD del dispositivo in blocco e frequenze di clock fino a 3,5 GHz.

Tutte le macchine virtuali serie HBv3 offrono 200 Gb/sec HDR InfiniBand da NVIDIA Networking per abilitare carichi di lavoro MPI su scala supercomputer. Queste macchine virtuali sono connesse in un albero di grasso non bloccato per prestazioni RDMA ottimizzate e coerenti. L'infrastruttura HDR InfiniBand supporta anche il routing adattivo e il trasporto connesso dinamico (DCT, oltre ai trasporti RC e UD standard). Queste funzionalità migliorano le prestazioni dell'applicazione, la scalabilità e la coerenza e l'utilizzo è fortemente consigliato.

Serie HBv2 Le macchine virtuali sono ottimizzate per le applicazioni basate sulla larghezza di banda della memoria, ad esempio la dinamica fluida, l'analisi degli elementi finiti e la simulazione del serbatoio. Le macchine virtuali HBv2 dispongono di core processore AMD EPYC 7742, 4 GB di RAM per core CPU e nessun multithreading simultaneo. Ogni macchina virtuale HBv2 offre fino a 340 GB/sec di larghezza di banda di memoria e fino a 4 teraFLOPS di calcolo FP64.

Le macchine virtuali HBv2 presentano 200 Gb/sec Mellanox HDR InfiniBand, mentre le macchine virtuali serie HB e HC presentano 100 Gb/sec Mellanox EDR InfiniBand. Ognuno di questi tipi di macchina virtuale è connesso in un albero grasso non bloccato per prestazioni RDMA ottimizzate e coerenti. Le macchine virtuali HBv2 supportano il routing adattivo e il trasporto connesso dinamico (DCT, oltre ai trasporti RC e UD standard). Queste funzionalità migliorano le prestazioni dell'applicazione, la scalabilità e la coerenza e l'utilizzo è fortemente consigliato.

Serie HB Le macchine virtuali sono ottimizzate per le applicazioni basate sulla larghezza di banda della memoria, ad esempio le dinamiche fluide, l'analisi esplicita degli elementi finiti e la modellazione meteo. Le macchine virtuali HB offrono 60 core di processore AMD EPYC 7551, 4 GB di RAM per core CPU e nessun hyperthreading. La piattaforma AMD EPYC offre più di 260 GB/sec di larghezza di banda di memoria.

Serie HC Le macchine virtuali sono ottimizzate per le applicazioni basate sul calcolo denso, ad esempio l'analisi implicita degli elementi finiti, le dinamiche molecolari e la chimica computazionale. Le macchine virtuali HC offrono 44 core del processore Intel Xeon Platinum 8168, 8 GB di RAM per core CPU e nessun hyperthreading. La piattaforma Intel Xeon Platinum supporta l'ecosistema avanzato di strumenti software di Intel, ad esempio la libreria Intel Math Kernel.

Nota

Tutte le macchine virtuali HBv3, HBv2, HB e serie HC hanno accesso esclusivo ai server fisici. Esistono solo 1 VM per server fisico e non è disponibile alcuna multi-tenancy condivisa con altre macchine virtuali per queste dimensioni della macchina virtuale.

Istanze con supporto per RDMA

La maggior parte delle dimensioni della macchina virtuale HPC include un'interfaccia di rete per la connettività RDMA (Remote Direct Memory Access). Le dimensioni della serie N selezionate designata con 'r' sono anche compatibili con RDMA. Questa interfaccia è oltre all'interfaccia di rete Ethernet standard di Azure disponibile nelle altre dimensioni della macchina virtuale.

Questa interfaccia secondaria consente alle istanze con funzionalità RDMA di comunicare tramite una rete IB (InfiniBand), operando a velocità HDR per HBv3, HBv2, frequenza EDR per le tariffe HB, HC, NDv2 e FDR per H16r, H16mr e altre macchine virtuali con funzionalità N con supporto per RDMA. Queste funzionalità RDMA possono migliorare la scalabilità e le prestazioni delle applicazioni basate su Message Passing Interface (MPI).

Nota

Supporto SR-IOV: in Azure HPC attualmente sono disponibili due classi di macchine virtuali a seconda che siano abilitate per InfiniBand. Attualmente, quasi tutte le macchine virtuali abilitate per RDMA o InfiniBand in Azure sono abilitate per SR-IOV, ad eccezione di H16r, H16mr e NC24r. RDMA è abilitato solo sulla rete IB (InfiniBand) ed è supportato per tutte le macchine virtuali con supporto per RDMA. IP su IB è supportato solo nelle macchine virtuali abilitate per SR-IOV. RDMA non è abilitato tramite la rete Ethernet.

  • Sistema operativo : le distribuzioni Linux come CentOS, RHEL, Ubuntu, SUSE vengono comunemente usate. Windows Server 2016 e versioni più recenti sono supportate in tutte le macchine virtuali della serie HPC. Si noti che Windows Server 2012 R2 non è supportato in HBv2 in seguito come dimensioni della macchina virtuale con più di 64 core (virtuali o fisici). Vedere Immagini vm per un elenco di immagini di macchine virtuali supportate nel Marketplace e come possono essere configurate in modo appropriato. Le rispettive pagine di dimensioni della macchina virtuale elencano anche il supporto dello stack software.

  • InfiniBand and Driver : nelle macchine virtuali abilitate per InfiniBand, sono necessari i driver appropriati per abilitare RDMA. Vedere Immagini vm per un elenco di immagini di macchine virtuali supportate nel Marketplace e come possono essere configurate in modo appropriato. Vedere anche l'abilitazione di InfiniBand per informazioni sulle estensioni della macchina virtuale o sull'installazione manuale dei driver InfiniBand.

  • MPI : le dimensioni delle macchine virtuali abilitate per SR-IOV in Azure consentono quasi qualsiasi sapore di MPI da usare con Mellanox OFED. Per altre informazioni sulla configurazione di MPI nelle macchine virtuali HPC in Azure, vedere Configurare MPI per HPC .

    Nota

    Spazio indirizzi di rete RDMA: la rete RDMA in Azure riserva lo spazio indirizzi 172.16.0.0/16. Per eseguire applicazioni MPI in istanze distribuite in una rete virtuale di Azure, assicurarsi che lo spazio degli indirizzi di rete virtuale non si sovrapponga alla rete RDMA.

Opzioni di configurazione del cluster

Azure offre diverse opzioni per creare cluster di macchine virtuali HPC che possono comunicare tramite la rete RDMA, tra cui:

  • Macchine virtuali: distribuire le macchine virtuali HPC con supporto per RDMA nello stesso set di scalabilità o set di disponibilità (quando si usa il modello di distribuzione di Azure Resource Manager). Se si usa il modello di distribuzione classico, distribuire le macchine virtuali nello stesso servizio cloud.

  • Set di scalabilità di macchine virtuali: in un set di scalabilità di macchine virtuali assicurarsi di limitare la distribuzione a un singolo gruppo di posizionamento per la comunicazione InfiniBand all'interno del set di scalabilità. In un modello di Resource Manager, ad esempio, impostare la proprietà singlePlacementGroup su true. Si noti che le dimensioni massime del set di scalabilità che possono essere spostate con singlePlacementGroup=true sono limitate a 100 macchine virtuali per impostazione predefinita. Se le esigenze di scalabilità dei processi HPC sono superiori a 100 macchine virtuali in un singolo tenant, è possibile richiedere un aumento, aprire una richiesta di supporto clienti online senza alcun addebito. Il limite per il numero di macchine virtuali in un singolo set di scalabilità può essere aumentato a 300. Si noti che quando si distribuiscono macchine virtuali che usano set di disponibilità il limite massimo è pari a 200 macchine virtuali per set di disponibilità.

    Nota

    MPI tra le macchine virtuali: se RDMA (ad esempio usando la comunicazione MPI) è necessario tra macchine virtuali (VM), assicurarsi che le macchine virtuali si trovino nello stesso set di scalabilità di macchine virtuali o set di disponibilità.

  • Azure CycleCloud : creare un cluster HPC usando Azure CycleCloud per eseguire processi MPI.

  • Azure Batch: creare un pool di Azure Batch per eseguire carichi di lavoro MPI. Per usare istanze a elevato uso di calcolo quando si eseguono applicazioni MPI con Azure Batch, vedere Usare le attività a istanze multiple per eseguire applicazioni MPI (Message Passing Interface) in Azure Batch.

  • Microsoft HPC Pack - HPC Pack include un ambiente di runtime per MS-MPI che usa la rete RDMA di Azure quando viene distribuita nelle macchine virtuali Linux con supporto per RDMA. Ad esempio, vedere Configurare un cluster RDMA Linux con HPC Pack per eseguire applicazioni MPI.

Considerazioni sulla distribuzione

  • Sottoscrizione di Azure: per distribuire numerose istanze a elevato utilizzo di calcolo, prendere in considerazione una sottoscrizione con pagamento in base al consumo o altre opzioni di acquisto. Con un account gratuito di Azureè possibile usare solo un numero limitato di core di calcolo di Azure.

  • Prezzi e disponibilità: controllare i prezzi e la disponibilità delle macchine virtuali in base alle aree di Azure.

  • Quota di core: potrebbe essere necessario aumentare la quota di core nella sottoscrizione di Azure rispetto al valore predefinito. La sottoscrizione può anche limitare il numero di core che è possibile distribuire in alcune famiglie di dimensioni di macchina virtuale, inclusa la serie H. Per richiedere un aumento della quota, è possibile aprire una richiesta di assistenza clienti online senza alcun addebito. I limiti predefiniti possono variare in base alla categoria della sottoscrizione.

    Nota

    Se si hanno esigenze di capacità su larga scala, contattare il supporto di Azure. Le quote di Azure sono limiti di credito e non garanzie di capacità. A prescindere dalla quota, viene addebitato solo l'uso dei core effettivamente impiegati.

  • Rete virtuale: non è necessaria una rete virtuale di Azure per usare le istanze a elevato utilizzo di calcolo. Per molte distribuzioni è tuttavia necessaria almeno una rete virtuale di Azure basata sul cloud. Per l'accesso alle risorse locali, è necessaria anche una connessione da sito a sito. Quando è necessaria, creare una nuova rete virtuale per distribuire le istanze. L'aggiunta di una VM a elevato uso di calcolo a una rete virtuale in un gruppo di affinità non è supportata.

  • Ridimensionamento : a causa del relativo hardware specializzato, è possibile ridimensionare solo le istanze a elevato utilizzo di calcolo all'interno della stessa famiglia di dimensioni (serie H o serie N). Ad esempio, è possibile ridimensionare una VM della serie H solo da una dimensione della serie H a un'altra. Altre considerazioni sul supporto dei driver InfiniBand e sui dischi NVMe possono essere considerati per determinate macchine virtuali.

Altre dimensioni

Passaggi successivi