Bagikan melalui


Ringkasan komputer virtual seri HBv2

Berlaku untuk: ✔️ VM Linux VM ✔️ Windows VMs ✔️ Set skala fleksibel Set ✔️ skala seragam.

Memaksimalkan performa aplikasi komputasi berperforma tinggi (HPC) pada AMD EPYC membutuhkan pendekatan yang bijaksana untuk lokalitas memori dan penempatan proses. Di bawah ini kami menguraikan arsitektur AMD EPYC dan implementasinya di Azure untuk aplikasi HPC. Kami menggunakan istilah pNUMA untuk merujuk ke domain NUMA fisik, dan vNUMA untuk merujuk ke domain NUMA virtual.

Secara fisik, server seri HBv2 adalah CPU EPYC 7V12 2 * 64-core dengan total 128 core fisik. Multithreading Simultan (SMT) dinonaktifkan pada HBv2. 128 core ini dibagi menjadi 16 bagian (8 per soket), setiap bagian yang berisi 8 inti prosesor. Server Azure HBv2 juga menjalankan pengaturan AMD BIOS berikut:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

Akibatnya, server melakukan booting dengan 4 domain NUMA (2 per soket). Setiap domain berukuran 32 inti. Setiap NUMA memiliki akses langsung ke 4 saluran DRAM fisik yang beroperasi pada 3.200 MT/dtk.

Untuk menyediakan ruang bagi Azure hypervisor untuk beroperasi tanpa mengganggu VM, kami mencadangkan 8 core fisik per server.

topologi VM

Kami mencadangkan 8 inti host hypervisor ini secara simetris di kedua soket CPU, mengambil 2 inti pertama dari Core Complex Dies (CCD) tertentu pada setiap domain NUMA, dengan inti yang tersisa untuk VM seri HBv2. Batas CCD tidak setara dengan batas NUMA. Pada HBv2, sekelompok empat CCD berturut-turut (4) dikonfigurasi sebagai domain NUMA, baik di tingkat server host maupun dalam VM tamu. Dengan demikian, semua ukuran VM HBv2 mengekspos 4 domain NUMA yang muncul ke OS dan aplikasi. 4 domain NUMA yang seragam, masing-masing dengan jumlah core yang berbeda tergantung pada ukuran VM HBv2 tertentu.

Penyematan proses berfungsi pada VM seri HBv2 karena kami mengekspos silikon yang mendasar apa adanya ke VM tamu. Kami sangat merekomendasikan penyematan proses untuk performa dan konsistensi yang optimal.

Spesifikasi perangkat keras

Spesifikasi Perangkat Keras Komputer Virtual Seri HBv2
Core 120 (SMT dinonaktifkan)
CPU AMD EPYC 7V12
Frekuensi CPU (non-AVX) ~ 3,1 GHz (tunggal + semua inti)
Memori 4 GB/core (total 480 GB)
Disk Lokal 960 GiB NVMe (blok), SSD 480 GB (file halaman)
Infiniband 200 Gb/dtk HDR Mellanox ConnectX-6
Jaringan Ethernet 50 Gb/dtk (dapat digunakan 40 Gb/dtk) SmartNIC Gen kedua Azure

Spesifikasi perangkat lunak

Spesifikasi Perangkat Lunak Komputer Virtual Seri HBv2
Ukuran Max Pekerjaan MPI Core 36000 (Komputer virtual 300 dalam satu set skala komputer virtual dengan singlePlacementGroup=true)
Dukungan MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, MPI Platform
Kerangka Kerja Tambahan UCX, libfabric, PGAS
Dukungan Microsoft Azure Storage Disk Standar dan Premium (maksimal 8 disk)
Dukungan OS untuk SRIOV RDMA RHEL 7.9+, Ubuntu 18.04+, SLES 12 SP5+, WinServer 2016+
Dukungan Orchestrator CycleCloud, Batch, AKS; opsi konfigurasi kluster

Catatan

Windows Server 2012 R2 tidak didukung pada HBv2 dan komputer virtual lain dengan lebih dari 64 core (virtual atau fisik). Untuk informasi selengkapnya, lihat Sistem operasi tamu Windows yang didukung untuk Hyper-V di Windows Server.

Langkah berikutnya