Overzicht van virtuele machines uit de HB-serie
Let op
In dit artikel wordt verwezen naar CentOS, een Linux-distributie die de status End Of Life (EOL) nadert. Houd rekening met uw gebruik en plan dienovereenkomstig. Zie de Richtlijnen voor het einde van de levensduur van CentOS voor meer informatie.
Van toepassing op: ✔️ Virtuele Linux-machines voor Windows-VM's ✔️ ✔️ Flexibele schaalsets Uniform-schaalsets ✔️
Voor het maximaliseren van de prestaties van HPC-toepassingen (High Performance Compute) op AMD EPYC is een doordachte benadering van geheugenlocatie en procesplaatsing vereist. Hieronder vindt u een overzicht van de AMD EPYC-architectuur en de implementatie ervan in Azure voor HPC-toepassingen. We gebruiken de term 'pNUMA' om te verwijzen naar een fysiek NUMA-domein en 'vNUMA' om te verwijzen naar een gevirtualiseerd NUMA-domein.
Fysiek is een HB-serieserver 2 * 32 core EPYC 7551 CPU's voor in totaal 64 fysieke kernen. Deze 64 kernen zijn onderverdeeld in 16 pNUMA-domeinen (8 per socket), die elk vier kernen zijn en bekend staan als een 'CPU Complex' (of 'CCX'). Elke CCX heeft een eigen L3-cache, zoals een besturingssysteem een pNUMA/vNUMA-grens ziet. Een paar aangrenzende CCXs-shares hebben toegang tot twee kanalen van fysieke DRAM (32 GB DRAM in servers uit de HB-serie).
Om ruimte te bieden voor de Azure-hypervisor om te werken zonder de VM te verstoren, reserveren we fysieke pNUMA-domein 0 (de eerste CCX). Vervolgens wijzen we pNUMA-domeinen 1-15 (de resterende CCX-eenheden) toe voor de VIRTUELE machine. De VIRTUELE machine ziet het volgende:
(15 vNUMA domains) * (4 cores/vNUMA) = 60
kernen per VM
De VIRTUELE machine zelf weet niet dat pNUMA 0 er niet aan is gegeven. De VM begrijpt pNUMA 1-15 als vNUMA 0-14, met 7 vNUMA op vSocket 0 en 8 vNUMA op vSocket 1. Hoewel dit asymmetrisch is, moet uw besturingssysteem normaal opstarten en werken. Verderop in deze handleiding wordt uitgelegd hoe u MPI-toepassingen het beste kunt uitvoeren op deze asymmetrische NUMA-indeling.
Procespinning werkt op VM's uit de HB-serie, omdat we het onderliggende silicium als zodanig beschikbaar maken voor de gast-VM. We raden het vastmaken van processen ten zeerste aan voor optimale prestaties en consistentie.
In het volgende diagram ziet u de scheiding van kernen die zijn gereserveerd voor Azure Hypervisor en de VM uit de HB-serie.
Hardwarespecificaties
Hardwarespecificaties | VM uit de HB-serie |
---|---|
Kernen | 60 (SMT uitgeschakeld) |
CPU | AMD EPYC 7551 |
CPU-frequentie (niet-AVX) | ~2,55 GHz (enkel + alle kernen) |
Geheugen | 4 GB/kern (totaal 240 GB) |
Lokale schijf | 700 GB SSD |
Infiniband | 100 Gb EDR Mellanox Verbinding maken X-5 |
Netwerk | 50 Gb Ethernet (40 Gb bruikbaar) Azure second Gen SmartNIC |
Softwarespecificaties
Softwarespecificaties | VM uit de HB-serie |
---|---|
Maximale MPI-taakgrootte | 18000 kernen (300 VM's in één virtuele-machineschaalset met singlePlacementGroup=true) |
MPI-ondersteuning | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI |
Aanvullende frameworks | UCX, libfabric, PGAS |
Ondersteuning voor Azure Storage | Standard- en Premium-schijven (maximaal 4 schijven) |
Besturingssysteemondersteuning voor SRIOV RDMA | CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+ |
Orchestrator-ondersteuning | CycleCloud, Batch, AKS; opties voor clusterconfiguratie |
Belangrijk
Dit document verwijst naar een releaseversie van Linux die bijna of aan het einde van de levensduur (EOL) nadert. Overweeg om bij te werken naar een recentere versie.
Volgende stappen
- Meer informatie over AMD EPYC-architectuur en multi-chip architecturen. Zie de HPC Tuning Guide voor AMD EPYC-processors voor meer informatie.
- Lees meer over de nieuwste aankondigingen, voorbeelden van HPC-werkbelastingen en prestatieresultaten in de Blogs van de Azure Compute Tech Community.
- Zie High Performance Computing (HPC) op Azure voor een gedetailleerdere architectuurweergave van HPC-workloads die worden uitgevoerd.