Omówienie maszyny wirtualnej z serii HBv2
Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows ✔️ — elastyczne zestawy ✔️ skalowania.
Maksymalizowanie wydajności aplikacji obliczeniowych o wysokiej wydajności (HPC) na platformie AMD EPYC wymaga przemyślanego podejścia do lokalizacji pamięci i umieszczania procesów. Poniżej przedstawiono architekturę AMD EPYC i naszą implementację na platformie Azure dla aplikacji HPC. Termin pNUMA jest używany do odwoływania się do fizycznej domeny NUMA i architektury vNUMA w celu odwoływania się do zwirtualizowanej domeny NUMA.
Fizycznie serwer serii HBv2 to 2 * 64-rdzeniowy procesor EPYC 7V12 dla łącznie 128 rdzeni fizycznych. Jednoczesne wielowątkowość (SMT) jest wyłączona w HBv2. Te 128 rdzeni są podzielone na 16 sekcji (8 na gniazdo), każda sekcja zawiera 8 rdzeni procesora. Serwery usługi Azure HBv2 również uruchamiają następujące ustawienia systemu BIOS firmy AMD:
Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled
W rezultacie serwer uruchamia się z 4 domenami NUMA (2 na gniazdo). Każda domena ma rozmiar 32 rdzenie. Każda architektura NUMA ma bezpośredni dostęp do 4 kanałów fizycznej pamięci DRAM działającej na poziomie 3200 MT/s.
Aby zapewnić miejsce na działanie funkcji hypervisor platformy Azure bez zakłócania działania maszyny wirtualnej, rezerwujemy 8 rdzeni fizycznych na serwer.
Topologia maszyny wirtualnej
Rezerwujemy te 8 rdzeni hosta funkcji hypervisor symetrycznie w obu gniazdach procesora CPU, biorąc pierwsze 2 rdzenie z określonych rdzeni złożonych dies (CCD) w każdej domenie NUMA, z pozostałymi rdzeniami maszyny wirtualnej serii HBv2. Granica CCD nie jest równoważna granicy NUMA. W systemie HBv2 grupa czterech kolejnych (4) CCDs jest skonfigurowana jako domena NUMA, zarówno na poziomie serwera hosta, jak i na maszynie wirtualnej gościa. W związku z tym wszystkie rozmiary maszyn wirtualnych HBv2 uwidaczniają 4 domeny NUMA, które pojawiają się w systemie operacyjnym i aplikacji. 4 jednolite domeny NUMA, z których każda ma inną liczbę rdzeni w zależności od określonego rozmiaru maszyny wirtualnej HBv2.
Przypinanie procesów działa na maszynach wirtualnych serii HBv2, ponieważ uwidaczniamy bazowy krzem jako maszynę wirtualną gościa. Zdecydowanie zalecamy przypinanie procesów w celu uzyskania optymalnej wydajności i spójności.
Specyfikacje sprzętowe
Specyfikacje sprzętu | Maszyna wirtualna serii HBv2 |
---|---|
Rdzenie | 120 (wyłączono protokół SMT) |
Procesor CPU | AMD EPYC 7V12 |
Częstotliwość procesora CPU (inne niż AVX) | ~3,1 GHz (pojedynczy + wszystkie rdzenie) |
Pamięć | 4 GB/rdzeń (łącznie 480 GB) |
Dysk lokalny | 960 GiB NVMe (blok), 480 GB SSD (plik stronicowy) |
Infiniband | 200 Gb/s HDR Mellanox ConnectX-6 |
Sieć | Sieć Ethernet 50 Gb/s (40 Gb/s do użycia) Azure Second Gen SmartNIC |
Specyfikacje oprogramowania
Specyfikacje oprogramowania | Maszyna wirtualna serii HBv2 |
---|---|
Maksymalny rozmiar zadania MPI | 36000 rdzeni (300 maszyn wirtualnych w jednym zestawie skalowania maszyn wirtualnych z singlePlacementGroup=true) |
Obsługa interfejsu MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPII |
Dodatkowe struktury | UCX, libfabric, PGAS |
Obsługa usługi Azure Storage | Dyski w warstwie Standardowa i Premium (maksymalnie 8 dysków) |
Obsługa systemu operacyjnego dla SRIOV RDMA | RHEL 7.9+, Ubuntu 18.04+, SLES 12 SP5+, WinServer 2016+ |
Obsługa programu Orchestrator | CycleCloud, Batch, AKS; opcje konfiguracji klastra |
Uwaga
System Windows Server 2012 R2 nie jest obsługiwany na maszynach wirtualnych HBv2 i innych maszynach wirtualnych z więcej niż 64 rdzeniami (wirtualnymi lub fizycznymi). Aby uzyskać więcej informacji, zobacz Obsługiwane systemy operacyjne gościa systemu Windows dla funkcji Hyper-V w systemie Windows Server.
Następne kroki
- Aby uzyskać więcej informacji na temat architektury AMD EPYC i architektur wieloukładowych, zobacz Przewodnik po dostrajaniu HPC dla procesorów AMD EPYC.
- Aby uzyskać najnowsze ogłoszenia dotyczące przykładów obciążeń HPC i wyników wydajności, zobacz Blogi społeczności technicznej usługi Azure Compute.
- Aby uzyskać widok architektury wyższego poziomu na potrzeby uruchamiania obciążeń HPC, zobacz Obliczenia o wysokiej wydajności (HPC) na platformie Azure.