Condividi tramite


Panoramica delle macchine virtuali serie HC

Si applica a: ✔️ macchine virtuali Linux ✔️ macchine virtuali Windows ✔️ set di scalabilità flessibili ✔️ set di scalabilità uniformi

L'ottimizzazione delle prestazioni delle applicazioni HPC nei processori scalabili Intel Xeon richiede un approccio ponderato per elaborare il posizionamento in questa nuova architettura. Di seguito viene illustrata l'implementazione di questa nelle macchine virtuali serie HC di Azure per le applicazioni HPC. Si userà il termine "pNUMA" per fare riferimento a un dominio NUMA fisico e a "vNUMA" per fare riferimento a un dominio NUMA virtualizzato. Analogamente, si userà il termine "pCore" per fare riferimento a core CPU fisici e "vCore" per fare riferimento ai core CPU virtualizzati.

Fisicamente, un server serie HC è 2 * 24 core Intel Xeon Platinum 8168 CPU per un totale di 48 core fisici. Ogni CPU è un singolo dominio pNUMA e ha accesso unificato a sei canali di DRAM. Le CPU Intel Xeon Platinum includono una cache L2 4 volte superiore rispetto alle generazioni precedenti (256 KB/core -> 1 MB/core), riducendo anche la cache L3 rispetto alle CPU Intel precedenti (2,5 MB/core -> 1,375 MB/core).

La topologia precedente passa anche alla configurazione dell'hypervisor della serie HC. Per fornire spazio per il funzionamento dell'hypervisor di Azure senza interferire con la macchina virtuale, si riservano pCore 0-1 e 24-25 (ovvero i primi 2 pCore su ogni socket). Verranno quindi assegnati domini pNUMA a tutti i core rimanenti alla macchina virtuale. Di conseguenza, la macchina virtuale visualizzerà:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 core per macchina virtuale

La macchina virtuale non conosce che non sono stati assegnati pCore 0-1 e 24-25. Espone quindi ogni vNUMA come se avesse 22 core in modo nativo.

Le CPU Intel Xeon Platinum, Gold e Silver introducono anche una rete mesh 2D on-die per la comunicazione all'interno e all'esterno del socket DELLA CPU. È consigliabile aggiungere processi per ottenere prestazioni e coerenza ottimali. L'aggiunta del processo funzionerà sulle macchine virtuali serie HC perché il processore sottostante viene esposto così come è alla macchina virtuale guest.

Il diagramma seguente illustra la separazione dei core riservati per Hypervisor di Azure e la macchina virtuale serie HC.

Separazione dei core riservati per macchine virtuali hypervisor e serie HC di Azure

Specifiche hardware

Specifiche hardware Macchina virtuale serie HC
Core 44 (HT disabilitato)
CPU Intel Xeon Platinum 8168
Frequenza CPU (non AVX) 3,7 GHz (core singolo), 2,7-3,4 GHz (tutti i core)
Memoria 8 GB/core (352 totale)
Disco locale SSD da 700 GB
Infiniband 100 Gb EDR Mellanox ConnectX-5
Rete 50 Gb Ethernet (utilizzabile da 40 GB) SmartNIC di seconda generazione di Azure

Specifiche software

Specifiche software Macchina virtuale serie HC
Dimensioni massime processo MPI 13200 core (300 macchine virtuali in un singolo set di scalabilità di macchine virtuali con singlePlacementGroup=true)
Supporto MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Framework aggiuntivi UCX, libfabric, PGAS
supporto Archiviazione di Azure Dischi Standard e Premium (massimo 4 dischi)
Supporto del sistema operativo per SRIOV RDMA RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+
Supporto di Orchestrator CycleCloud, Batch, servizio Azure Kubernetes; Opzioni di configurazione del cluster

Importante

  • Questo documento fa riferimento a una versione di Linux vicina o alla fine della vita (EOL). Prendere in considerazione l'aggiornamento a una versione più recente.
  • Non è disponibile alcun supporto ufficiale a livello di kernel da AMD in CentOS. Il supporto inizia da RHEL.

Passaggi successivi

  • Altre informazioni sull'architettura intel Xeon SP.
  • Per informazioni sugli annunci più recenti, sugli esempi di carico di lavoro HPC e sui risultati delle prestazioni, vedere i blog della community tecnica di calcolo di Azure.
  • Per un quadro generale sull'architettura per l'esecuzione di carichi di lavoro HPC, vedere HPC (High Performance Computing) in Azure.