Ringkasan komputer virtual seri HB

Perhatian

Artikel ini mereferensikan CentOS, distribusi Linux yang mendekati status End Of Life (EOL). Harap pertimbangkan penggunaan dan rencanakan yang sesuai. Untuk informasi selengkapnya, lihat panduan Akhir Masa Pakai CentOS.

Berlaku untuk: ✔️ Mesin virtual Linux ✔️ Mesin virtual Windows ✔️ Set skala fleksibel ✔️ Set skala seragam

Memaksimalkan performa aplikasi komputasi berperforma tinggi (HPC) pada AMD EPYC membutuhkan pendekatan yang bijaksana untuk lokalitas memori dan penempatan proses. Di bawah ini kami menguraikan arsitektur AMD EPYC dan implementasinya di Azure untuk aplikasi HPC. Kami akan menggunakan istilah "pNUMA" untuk merujuk ke domain fisik NUMA, dan "vNUMA" untuk merujuk ke domain virtual NUMA.

Secara fisik, server seri HB adalah CPU EPYC 7551 2 * 32-core dengan total 64 inti fisik. 64 inti ini dibagi menjadi 16 domain pNUMA (8 per soket), masing-masing empat core dan dikenal sebagai "Kompleks CPU" (atau "CCX"). Setiap CCX memiliki cache L3 sendiri, yaitu bagaimana OS akan melihat batas pNUMA/vNUMA. Sepasang CCX yang berdekatan menggunakan akses bersama ke dua saluran DRAM fisik (32 GB DRAM di server seri HB).

Untuk menyediakan ruang bagi hypervisor Azure untuk beroperasi tanpa mengganggu VM, kami memesan domain fisik pNUMA 0 (CCX pertama). Kami kemudian menetapkan domain pNUMA 1-15 (unit CCX yang tersisa) untuk VM. VM akan memiliki:

(15 vNUMA domains) * (4 cores/vNUMA) = 60 inti per VM

VM itu sendiri tidak tahu bahwa pNUMA 0 tidak diberikan untuk itu. VM memahami pNUMA 1-15 sebagai vNUMA 0-14, dengan 7 vNUMA pada vSocket 0 dan 8 vNUMA pada vSocket 1. Meskipun asimetris, OS Anda harus boot dan beroperasi secara normal. Kemudian, dalam panduan ini, kami menginstruksikan cara terbaik untuk menjalankan aplikasi MPI pada tata letak NUMA asimetris ini.

Penyematan proses akan bekerja pada VM seri HB karena kami memperlihatkan apa adanya silikon yang mendasarinya pada VM tamu. Kami sangat merekomendasikan penyematan proses untuk performa dan konsistensi yang optimal.

Diagram berikut menunjukkan pemisahan inti yang disediakan untuk Azure Hypervisor dan VM seri HB.

Pemisahan inti yang disediakan untuk Azure Hypervisor dan VM seri HB

Spesifikasi perangkat keras

Spesifikasi Perangkat Keras VM seri HB
Core 60 (SMT dinonaktifkan)
CPU AMD EPYC 7551
Frekuensi CPU (non-AVX) ~ 2,55 GHz (tunggal + semua inti)
Memori 4 GB/inti (total 240 GB)
Disk Lokal SSD 700 GB
Infiniband 100 Gb EDR Mellanox ConnectX-5
Jaringan 50 Gb Ethernet (40 Gb dapat digunakan) Azure SmartNIC Generasi kedua

Spesifikasi perangkat lunak

Spesifikasi Perangkat Lunak VM seri HB
Ukuran Max Pekerjaan MPI 18000 inti (300 VM dalam satu set skala komputer virtual dengan singlePlacementGroup=true)
Dukungan MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, MPI Platform
Kerangka Kerja Tambahan UCX, libfabric, PGAS
Dukungan Microsoft Azure Storage Disk Standar dan Premium (maksimal 4 disk)
Dukungan OS untuk SRIOV RDMA CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Dukungan Orchestrator CycleCloud, Batch, AKS; opsi konfigurasi kluster

Penting

Dokumen ini mereferensikan versi rilis Linux yang mendekati atau di, End of Life(EOL). Harap pertimbangkan untuk memperbarui ke versi yang lebih baru.

Langkah berikutnya