Dela via


Översikt över virtuella datorer i HC-serien

Gäller för: ✔️ Virtuella Linux-datorer ✔️ med virtuella Windows-datorer ✔️ – flexibla skalningsuppsättningar ✔️ Enhetliga skalningsuppsättningar

För att maximera HPC-programprestanda på Intel Xeon Scalable Processors krävs en genomtänkt metod för att bearbeta placering på den nya arkitekturen. Här beskriver vi implementeringen av den på virtuella datorer i Azure HC-serien för HPC-program. Vi använder termen "pNUMA" för att referera till en fysisk NUMA-domän och "vNUMA" för att referera till en virtualiserad NUMA-domän. På samma sätt använder vi termen "pCore" för att referera till fysiska CPU-kärnor och "virtuell kärna" för att referera till virtualiserade CPU-kärnor.

Fysiskt är en HC-serieserver 2 * 24-kärnigt Intel Xeon Platinum 8168-processorer för totalt 48 fysiska kärnor. Varje CPU är en enda pNUMA-domän och har enhetlig åtkomst till sex kanaler med DRAM. Intel Xeon Platinum-processorer har en 4x större L2-cache än i tidigare generationer (256 kB/kärna –> 1 MB/kärna), samtidigt som L3-cachen minskar jämfört med tidigare Intel-processorer (2,5 MB/kärna –> 1,375 MB/kärna).

Topologin ovan överförs även till HC-seriens hypervisor-konfiguration. För att ge utrymme för Azure-hypervisor-programmet att fungera utan att störa den virtuella datorn reserverar vi pCores 0-1 och 24-25 (d.v.s. de första 2 pCores på varje socket). Sedan tilldelar vi pNUMA-domäner alla återstående kärnor till den virtuella datorn. Den virtuella datorn kommer därför att se:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 kärnor per virtuell dator

Den virtuella datorn har ingen kunskap om att pCores 0-1 och 24-25 inte gavs till den. Därför exponeras varje vNUMA som om den internt hade 22 kärnor.

Intel Xeon Platinum-, Gold- och Silver-processorer introducerar också ett 2D-nätnätverk på tärning för kommunikation inom och utanför CPU-socketen. Vi rekommenderar starkt att du fäster processen för optimal prestanda och konsekvens. Processfästning fungerar på virtuella datorer i HC-serien eftersom det underliggande kiselet exponeras i befintligt fall för den virtuella gästdatorn.

Följande diagram visar uppdelningen av kärnor som är reserverade för Azure Hypervisor och den virtuella datorn i HC-serien.

Uppdelning av kärnor som är reserverade för Azure Hypervisor och virtuella datorer i HC-serien

Maskinvaruspecifikationer

Maskinvaruspecifikationer Virtuell dator i HC-serien
Kärnor 44 (HT inaktiverad)
Processor Intel Xeon Platinum 8168
CPU-frekvens (icke-AVX) 3,7 GHz (en kärna), 2,7–3,4 GHz (alla kärnor)
Minne 8 GB/kärna (totalt 352)
Lokal disk 700 GB SSD
Infiniband 100 Gb EDR Mellanox ConnectX-5
Nätverk 50 Gb Ethernet (40 Gb användbart) Azure second Gen SmartNIC

Programvaruspecifikationer

Programvaruspecifikationer Virtuell dator i HC-serien
Maximal MPI-jobbstorlek 13200 kärnor (300 virtuella datorer i en enda VM-skalningsuppsättning med singlePlacementGroup=true)
MPI-support HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Ytterligare ramverk UCX, libfabric, PGAS
Stöd för Azure Storage Standard- och Premium-diskar (högst 4 diskar)
OS-stöd för SRIOV RDMA RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+
Stöd för Orchestrator CycleCloud, Batch, AKS; konfigurationsalternativ för kluster

Viktigt!

  • Det här dokumentet refererar till en versionsversion av Linux som närmar sig eller vid End of Life (EOL). Överväg att uppdatera till en mer aktuell version.
  • Det finns inget officiellt stöd på kernelnivå från AMD på CentOS. Stödet börjar på RHEL.

Nästa steg