Overzicht van virtuele machines uit de HB-serie

Let op

In dit artikel wordt verwezen naar CentOS, een Linux-distributie die de status End Of Life (EOL) nadert. Houd rekening met uw gebruik en plan dienovereenkomstig. Zie de Richtlijnen voor het einde van de levensduur van CentOS voor meer informatie.

Van toepassing op: ✔️ Virtuele Linux-machines voor Windows-VM's ✔️ ✔️ Flexibele schaalsets Uniform-schaalsets ✔️

Voor het maximaliseren van de prestaties van HPC-toepassingen (High Performance Compute) op AMD EPYC is een doordachte benadering van geheugenlocatie en procesplaatsing vereist. Hieronder vindt u een overzicht van de AMD EPYC-architectuur en de implementatie ervan in Azure voor HPC-toepassingen. We gebruiken de term 'pNUMA' om te verwijzen naar een fysiek NUMA-domein en 'vNUMA' om te verwijzen naar een gevirtualiseerd NUMA-domein.

Fysiek is een HB-serieserver 2 * 32 core EPYC 7551 CPU's voor in totaal 64 fysieke kernen. Deze 64 kernen zijn onderverdeeld in 16 pNUMA-domeinen (8 per socket), die elk vier kernen zijn en bekend staan als een 'CPU Complex' (of 'CCX'). Elke CCX heeft een eigen L3-cache, zoals een besturingssysteem een pNUMA/vNUMA-grens ziet. Een paar aangrenzende CCXs-shares hebben toegang tot twee kanalen van fysieke DRAM (32 GB DRAM in servers uit de HB-serie).

Om ruimte te bieden voor de Azure-hypervisor om te werken zonder de VM te verstoren, reserveren we fysieke pNUMA-domein 0 (de eerste CCX). Vervolgens wijzen we pNUMA-domeinen 1-15 (de resterende CCX-eenheden) toe voor de VIRTUELE machine. De VIRTUELE machine ziet het volgende:

(15 vNUMA domains) * (4 cores/vNUMA) = 60 kernen per VM

De VIRTUELE machine zelf weet niet dat pNUMA 0 er niet aan is gegeven. De VM begrijpt pNUMA 1-15 als vNUMA 0-14, met 7 vNUMA op vSocket 0 en 8 vNUMA op vSocket 1. Hoewel dit asymmetrisch is, moet uw besturingssysteem normaal opstarten en werken. Verderop in deze handleiding wordt uitgelegd hoe u MPI-toepassingen het beste kunt uitvoeren op deze asymmetrische NUMA-indeling.

Procespinning werkt op VM's uit de HB-serie, omdat we het onderliggende silicium als zodanig beschikbaar maken voor de gast-VM. We raden het vastmaken van processen ten zeerste aan voor optimale prestaties en consistentie.

In het volgende diagram ziet u de scheiding van kernen die zijn gereserveerd voor Azure Hypervisor en de VM uit de HB-serie.

Scheiding van kernen die zijn gereserveerd voor vm's uit de Azure Hypervisor- en HB-serie

Hardwarespecificaties

Hardwarespecificaties VM uit de HB-serie
Kernen 60 (SMT uitgeschakeld)
CPU AMD EPYC 7551
CPU-frequentie (niet-AVX) ~2,55 GHz (enkel + alle kernen)
Geheugen 4 GB/kern (totaal 240 GB)
Lokale schijf 700 GB SSD
Infiniband 100 Gb EDR Mellanox Verbinding maken X-5
Netwerk 50 Gb Ethernet (40 Gb bruikbaar) Azure second Gen SmartNIC

Softwarespecificaties

Softwarespecificaties VM uit de HB-serie
Maximale MPI-taakgrootte 18000 kernen (300 VM's in één virtuele-machineschaalset met singlePlacementGroup=true)
MPI-ondersteuning HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Aanvullende frameworks UCX, libfabric, PGAS
Ondersteuning voor Azure Storage Standard- en Premium-schijven (maximaal 4 schijven)
Besturingssysteemondersteuning voor SRIOV RDMA CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Orchestrator-ondersteuning CycleCloud, Batch, AKS; opties voor clusterconfiguratie

Belangrijk

Dit document verwijst naar een releaseversie van Linux die bijna of aan het einde van de levensduur (EOL) nadert. Overweeg om bij te werken naar een recentere versie.

Volgende stappen