Delen via


Overzicht van virtuele machines uit de HC-serie

Van toepassing op: ✔️ Virtuele Linux-machines voor Windows-VM's ✔️ ✔️ Flexibele schaalsets Uniform-schaalsets ✔️

Het maximaliseren van hpc-toepassingsprestaties op Intel Xeon Scalable Processors vereist een doordachte benadering voor het verwerken van plaatsing op deze nieuwe architectuur. Hier wordt een overzicht gegeven van onze implementatie op VM's uit de Azure HC-serie voor HPC-toepassingen. We gebruiken de term 'pNUMA' om te verwijzen naar een fysiek NUMA-domein en 'vNUMA' om te verwijzen naar een gevirtualiseerd NUMA-domein. Op dezelfde manier gebruiken we de term 'pCore' om te verwijzen naar fysieke CPU-kernen en 'vCore' om te verwijzen naar gevirtualiseerde CPU-kernen.

Fysiek is een HC-serie server 2 * 24 core Intel Xeon Platinum 8168 CPU's voor in totaal 48 fysieke kernen. Elke CPU is één pNUMA-domein en heeft geïntegreerde toegang tot zes kanalen van DRAM. Intel Xeon Platinum-CPU's hebben een 4x grotere L2-cache dan in eerdere generaties (256 KB/core -> 1 MB/core), terwijl ook de L3-cache wordt verminderd ten opzichte van eerdere Intel-CPU's (2,5 MB/kern -> 1,375 MB/core).

De bovenstaande topologie gaat ook over naar de hypervisorconfiguratie van de HC-serie. Om de Azure-hypervisor ruimte te bieden om te werken zonder de VM te verstoren, reserveren we pCores 0-1 en 24-25 (de eerste 2 pCores op elke socket). Vervolgens wijzen we pNUMA-domeinen toe aan alle resterende kernen aan de VIRTUELE machine. De VIRTUELE machine ziet er dus het volgende:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 kernen per VM

De VM weet niet dat pCores 0-1 en 24-25 er niet aan zijn gegeven. Het toont dus elke vNUMA alsof het systeem systeemeigen 22 kernen had.

Intel Xeon Platinum, Gold en Silver CPU's introduceren ook een on-die 2D mesh-netwerk voor communicatie binnen en buiten de CPU-socket. We raden het vastmaken van processen ten zeerste aan voor optimale prestaties en consistentie. Procespinning werkt op VM's uit de HC-serie, omdat het onderliggende silicium wordt blootgesteld aan de gast-VM.

In het volgende diagram ziet u de scheiding van kernen die zijn gereserveerd voor Azure Hypervisor en de VM uit de HC-serie.

Scheiding van kernen die zijn gereserveerd voor vm's uit de Azure Hypervisor- en HC-serie

Hardwarespecificaties

Hardwarespecificaties VM uit de HC-serie
Kernen 44 (HT uitgeschakeld)
CPU Intel Xeon Platinum 8168
CPU-frequentie (niet-AVX) 3,7 GHz (enkele kern), 2,7-3,4 GHz (alle kernen)
Geheugen 8 GB/kern (totaal 352)
Lokale schijf 700 GB SSD
Infiniband 100 Gb EDR Mellanox ConnectX-5
Netwerk 50 Gb Ethernet (40 Gb bruikbaar) Azure second Gen SmartNIC

Softwarespecificaties

Softwarespecificaties VM uit de HC-serie
Maximale MPI-taakgrootte 13200 kernen (300 VM's in één virtuele-machineschaalset met singlePlacementGroup=true)
MPI-ondersteuning HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Aanvullende frameworks UCX, libfabric, PGAS
Ondersteuning voor Azure Storage Standard- en Premium-schijven (maximaal 4 schijven)
Besturingssysteemondersteuning voor SRIOV RDMA RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+
Orchestrator-ondersteuning CycleCloud, Batch, AKS; opties voor clusterconfiguratie

Notitie

Officiële ondersteuning op kernelniveau van AMD begint met RHEL 8.6 en AlmaLinux 8.6, een afgeleide van RHEL.

Volgende stappen