Přehled virtuálních počítačů řady HB
Platí pro: ✔️ Virtuální počítače s Windows s Linuxem ✔️ ✔️ – Flexibilní škálovací sady Uniform Scale Sets ✔️
Maximalizace výkonu aplikací vysokovýkonného výpočetního prostředí (HPC) v AMD EPYC vyžaduje promyšlenou lokalitu paměti a umístění procesů. Níže si projdeme architekturu AMD EPYC a naši implementaci v Azure pro aplikace HPC. Výraz "pNUMA" používáme k odkaz na fyzickou doménu NUMA a "vNUMA" odkazující na virtualizovanou doménu NUMA.
Server řady HB-series je fyzicky 2 * 32jádrový procesor EPYC 7551 pro celkem 64 fyzických jader. Těchto 64 jader je rozděleno do 16 domén pNUMA (8 na soket), z nichž každý je čtyři jádra a označuje se jako "CPU Complex" (neboli "CCX"). Každý CCX má vlastní mezipaměť L3, což je způsob, jakým operační systém vidí hranice pNUMA/vNUMA. Dvojice sousedních CCXs sdílí přístup ke dvěma kanálům fyzickéHO DRAM (32 GB DRAM na serverech řady HB-series).
Abychom zajistili prostor pro provoz hypervisoru Azure bez narušení virtuálního počítače, vyhrazujeme si fyzickou doménu pNUMA 0 (první CCX). Potom pro virtuální počítač přiřadíme domény pNUMA 1–15 (zbývající jednotky CCX). Virtuální počítač uvidí:
(15 vNUMA domains) * (4 cores/vNUMA) = 60
Jádra na virtuální počítač
Samotný virtuální počítač neví, že mu pNUMA 0 nebylo přiděleno. Virtuální počítač rozumí pNUMA 1-15 jako vNUMA 0-14, s 7 vNUMA na vSocket 0 a 8 vNUMA na vSocket 1. I když je to asymetrický, operační systém by se měl spouštět a normálně fungovat. Dále v této příručce dáváme pokyn, jak nejlépe spouštět aplikace MPI v tomto asymetrického rozložení NUMA.
Připnutí procesu bude fungovat na virtuálních počítačích řady HB-series, protože zveřejníme základní silicon tak, jak je pro hostovaný virtuální počítač. Důrazně doporučujeme připnout proces pro optimální výkon a konzistenci.
Následující diagram znázorňuje oddělení jader vyhrazených pro Azure Hypervisor a virtuální počítač řady HB-series.
Specifikace hardwaru
Specifikace hardwaru | Virtuální počítač řady HB-series |
---|---|
Cores | 60 (SMT zakázáno) |
Procesor | AMD EPYC 7551 |
Frekvence procesoru (bez AVX) | ~2,55 GHz (jedno + všechna jádra) |
Memory (Paměť) | 4 GB/jádro (celkem 240 GB) |
Místní disk | 700 GB SSD |
Infiniband | 100 Gb EDR Mellanox ConnectX-5 |
Síť | 50 Gb Ethernetu (40 Gb využitelné) Azure second SmartNIC |
Specifikace softwaru
Specifikace softwaru | Virtuální počítač řady HB-series |
---|---|
Maximální velikost úlohy MPI | 18000 jader (300 virtuálních počítačů ve škálovací sadě virtuálních počítačů s singlePlacementGroup=true) |
Podpora MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, PLATFORMA MPI |
Další architektury | UCX, libfabric, PGAS |
Podpora služby Azure Storage | Disky Úrovně Standard a Premium (maximálně 4 disky) |
Podpora operačního systému pro SRIOV RDMA | RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+ |
Podpora orchestratoru | CycleCloud, Batch, AKS; Možnosti konfigurace clusteru |
Důležité
Tento dokument odkazuje na verzi Linuxu, která se blíží nebo na konci životnosti (EOL). Zvažte aktualizaci na aktuálnější verzi.
Další kroky
- Přečtěte si další informace o architektuře AMD EPYC a architekturách s více čipy. Podrobnější informace najdete v průvodci laděním HPC pro procesory AMD EPYC.
- Přečtěte si o nejnovějších oznámeních, příkladech úloh PROSTŘEDÍ HPC a výsledcích výkonu na blogech technické komunity Azure Compute.
- Přehled architektury vyšší úrovně spouštění úloh PROSTŘEDÍ HPC najdete v tématu Vysokovýkonné výpočetní prostředí (HPC) v Azure.