Ringkasan komputer virtual seri HB
Berlaku untuk: ✔️ Mesin virtual Linux ✔️ Mesin virtual Windows ✔️ Set skala fleksibel ✔️ Set skala seragam
Memaksimalkan performa aplikasi komputasi berperforma tinggi (HPC) pada AMD EPYC membutuhkan pendekatan yang bijaksana untuk lokalitas memori dan penempatan proses. Di bawah ini kami menguraikan arsitektur AMD EPYC dan implementasinya di Azure untuk aplikasi HPC. Kami menggunakan istilah "pNUMA" untuk merujuk ke domain NUMA fisik, dan "vNUMA" untuk merujuk ke domain NUMA virtual.
Secara fisik, server seri HB adalah CPU EPYC 7551 2 * 32-core dengan total 64 inti fisik. 64 inti ini dibagi menjadi 16 domain pNUMA (8 per soket), masing-masing empat core dan dikenal sebagai "Kompleks CPU" (atau "CCX"). Setiap CCX memiliki cache L3 sendiri, yaitu bagaimana OS melihat batas pNUMA/vNUMA. Sepasang CCX yang berdekatan menggunakan akses bersama ke dua saluran DRAM fisik (32 GB DRAM di server seri HB).
Untuk menyediakan ruang bagi hypervisor Azure untuk beroperasi tanpa mengganggu VM, kami memesan domain fisik pNUMA 0 (CCX pertama). Kami kemudian menetapkan domain pNUMA 1-15 (unit CCX yang tersisa) untuk VM. VM melihat:
(15 vNUMA domains) * (4 cores/vNUMA) = 60
inti per VM
VM itu sendiri tidak tahu bahwa pNUMA 0 tidak diberikan untuk itu. VM memahami pNUMA 1-15 sebagai vNUMA 0-14, dengan 7 vNUMA pada vSocket 0 dan 8 vNUMA pada vSocket 1. Meskipun asimetris, OS Anda harus boot dan beroperasi secara normal. Kemudian, dalam panduan ini, kami menginstruksikan cara terbaik untuk menjalankan aplikasi MPI pada tata letak NUMA asimetris ini.
Penyematan proses akan bekerja pada VM seri HB karena kami memperlihatkan apa adanya silikon yang mendasarinya pada VM tamu. Kami sangat merekomendasikan penyematan proses untuk performa dan konsistensi yang optimal.
Diagram berikut menunjukkan pemisahan inti yang disediakan untuk Azure Hypervisor dan VM seri HB.
Spesifikasi perangkat keras
Spesifikasi Perangkat Keras | VM seri HB |
---|---|
Core | 60 (SMT dinonaktifkan) |
CPU | AMD EPYC 7551 |
Frekuensi CPU (non-AVX) | ~ 2,55 GHz (tunggal + semua inti) |
Memori | 4 GB/inti (total 240 GB) |
Disk Lokal | SSD 700 GB |
Infiniband | 100 Gb EDR Mellanox ConnectX-5 |
Jaringan | 50 Gb Ethernet (40 Gb dapat digunakan) Azure SmartNIC Generasi kedua |
Spesifikasi perangkat lunak
Spesifikasi Perangkat Lunak | VM seri HB |
---|---|
Ukuran Max Pekerjaan MPI | 18000 inti (300 VM dalam satu set skala komputer virtual dengan singlePlacementGroup=true) |
Dukungan MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, MPI Platform |
Kerangka Kerja Tambahan | UCX, libfabric, PGAS |
Dukungan Microsoft Azure Storage | Disk Standar dan Premium (maksimal 4 disk) |
Dukungan OS untuk SRIOV RDMA | RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+ |
Dukungan Orchestrator | CycleCloud, Batch, AKS; opsi konfigurasi kluster |
Penting
Dokumen ini mereferensikan versi rilis Linux yang mendekati atau di, End of Life(EOL). Harap pertimbangkan untuk memperbarui ke versi yang lebih baru.
Langkah berikutnya
- Pelajari lebih lanjut tentang arsitektur AMD EPYC dan arsitektur multichip. Untuk informasi lebih rinci, lihat Panduan Penyetelan HPC untuk Prosesor AMD EPYC.
- Membaca tentang pengumuman terbaru, contoh beban kerja HPC, dan hasil performa di Blog Komunitas Teknologi Azure Compute.
- Untuk tampilan arsitektur tingkat yang lebih tinggi dari beban kerja HPC yang berjalan, lihat Komputasi Kinerja Tinggi (HPC) pada Azure.