Performa komputer virtual seri HBv3
Berlaku untuk: ✔️ Mesin virtual Linux ✔️ Mesin virtual Windows ✔️ Set skala fleksibel ✔️ Set skala seragam
Ekspektasi performa menggunakan mikrobenchmark HPC umum adalah sebagai berikut:
Beban kerja | HBv3 |
---|---|
STREAM Triad | 330-350 GB/dtk (ditingkatkan hingga 630 GB/dtk) |
Linpack Performa-Tinggi (HPL) | 4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) untuk ukuran VM 120-core |
bandwidth dan latensi RDMA | 1,2 mikrodetik (1 byte), 192 GB/dtk (satu arah) |
FIO di SSD NVMe lokal (RAID0) | 7 GB/dtk baca, 3 GB/dtk tulis; 186k IOPS baca, 201k IOPS tulis |
Penyematan proses
Penyematan proses berfungsi dengan baik pada VM seri HBv3 karena kami mengekspos silikon yang mendasarinya apa adanya ke VM tamu. Kami sangat merekomendasikan penyematan proses untuk performa dan konsistensi yang optimal.
Latensi MPI
Pengujian latensi MPI dari rangkaian microbenchmark OSU dapat dijalankan seperti yang ditunjukkan. Skrip sampel ada di GitHub.
./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency
Bandwidth MPI
Tes bandwidth MPI dari rangkaian microbenchmark OSU dapat dieksekusi seperti di bawah ini. Skrip sampel ada di GitHub.
./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw
Mellanox Perftest
Paket Mellanox Perftest memiliki banyak pengujian InfiniBand seperti latensi (ib_send_lat) dan bandwidth (ib_send_bw). Contoh perintah ada di bawah ini.
numactl --physcpubind=[INSERT CORE #] ib_send_lat -a
Langkah berikutnya
- Pelajari tentang penskalaan aplikasi MPI.
- Tinjau performa dan hasil skalabilitas aplikasi HPC pada VM HBv3 di artikel TechCommunity.
- Membaca tentang pengumuman terbaru, contoh beban kerja HPC, dan hasil performa di Blog Komunitas Teknologi Azure Compute.
- Untuk tampilan arsitektur tingkat tinggi dalam menjalankan beban kerja HPC, lihat Komputasi Performa Tinggi (HPC) di Azure.