Översikt över virtuella datorer i HC-serien

Varning

Den här artikeln refererar till CentOS, en Linux-distribution som närmar sig EOL-status (End Of Life). Överväg att använda och planera i enlighet med detta. Mer information finns i CentOS End Of Life-vägledningen.

Gäller för: ✔️ Virtuella Linux-datorer ✔️ med virtuella Windows-datorer ✔️ – flexibla skalningsuppsättningar ✔️ Enhetliga skalningsuppsättningar

För att maximera HPC-programprestanda på Intel Xeon Scalable Processors krävs en genomtänkt metod för att bearbeta placering på den nya arkitekturen. Här beskriver vi implementeringen av den på virtuella datorer i Azure HC-serien för HPC-program. Vi använder termen "pNUMA" för att referera till en fysisk NUMA-domän och "vNUMA" för att referera till en virtualiserad NUMA-domän. På samma sätt använder vi termen "pCore" för att referera till fysiska CPU-kärnor och "virtuell kärna" för att referera till virtualiserade CPU-kärnor.

Fysiskt är en HC-serieserver 2 * 24-kärnigt Intel Xeon Platinum 8168-processorer för totalt 48 fysiska kärnor. Varje CPU är en enda pNUMA-domän och har enhetlig åtkomst till sex kanaler med DRAM. Intel Xeon Platinum-processorer har en 4x större L2-cache än i tidigare generationer (256 kB/kärna –> 1 MB/kärna), samtidigt som L3-cachen minskar jämfört med tidigare Intel-processorer (2,5 MB/kärna –> 1,375 MB/kärna).

Topologin ovan överförs även till HC-seriens hypervisor-konfiguration. För att ge utrymme för Azure-hypervisor-programmet att fungera utan att störa den virtuella datorn reserverar vi pCores 0-1 och 24-25 (d.v.s. de första 2 pCores på varje socket). Sedan tilldelar vi pNUMA-domäner alla återstående kärnor till den virtuella datorn. Den virtuella datorn kommer därför att se:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 kärnor per virtuell dator

Den virtuella datorn har ingen kunskap om att pCores 0-1 och 24-25 inte gavs till den. Därför exponeras varje vNUMA som om den internt hade 22 kärnor.

Intel Xeon Platinum-, Gold- och Silver-processorer introducerar också ett 2D-nätnätverk på tärning för kommunikation inom och utanför CPU-socketen. Vi rekommenderar starkt att du fäster processen för optimal prestanda och konsekvens. Processfästning fungerar på virtuella datorer i HC-serien eftersom det underliggande kiselet exponeras i befintligt fall för den virtuella gästdatorn.

Följande diagram visar uppdelningen av kärnor som är reserverade för Azure Hypervisor och den virtuella datorn i HC-serien.

Uppdelning av kärnor som är reserverade för Azure Hypervisor och virtuella datorer i HC-serien

Maskinvaruspecifikationer

Maskinvaruspecifikationer Virtuell dator i HC-serien
Kärnor 44 (HT inaktiverad)
Processor Intel Xeon Platinum 8168
CPU-frekvens (icke-AVX) 3,7 GHz (en kärna), 2,7–3,4 GHz (alla kärnor)
Minne 8 GB/kärna (totalt 352)
Lokal disk 700 GB SSD
Infiniband 100 Gb Identifiering och åtgärd på slutpunkt Mellanox Anslut X-5
Nätverk 50 Gb Ethernet (40 Gb användbart) Azure second Gen SmartNIC

Programvaruspecifikationer

Programvaruspecifikationer Virtuell dator i HC-serien
Maximal MPI-jobbstorlek 13200 kärnor (300 virtuella datorer i en enda VM-skalningsuppsättning med singlePlacementGroup=true)
MPI-support HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Ytterligare ramverk UCX, libfabric, PGAS
Stöd för Azure Storage Standard- och Premium-diskar (högst 4 diskar)
OS-stöd för SRIOV RDMA CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Stöd för Orchestrator CycleCloud, Batch, AKS; konfigurationsalternativ för kluster

Viktigt!

Det här dokumentet refererar till en versionsversion av Linux som närmar sig eller vid End of Life (EOL). Överväg att uppdatera till en mer aktuell version.

Nästa steg