Share via


Prestanda för virtuella datorer i HBv3-serien

Gäller för: ✔️ Virtuella Linux-datorer ✔️ med virtuella Windows-datorer ✔️ – flexibla skalningsuppsättningar ✔️ Enhetliga skalningsuppsättningar

Prestandaförväntningar med hjälp av vanliga HPC-mikrobenchstämplar är följande:

Arbetsbelastning HBv3
STREAM Triad 330–350 GB/s (förstärkt upp till 630 GB/s)
Högpresterande Linpack (HPL) 4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) för vm-storlek med 120 kärnor
RDMA-svarstid och bandbredd 1,2 mikrosekunder (1 byte), 192 GB/s (enkelriktat)
FIO på lokala NVMe SSD (RAID0) 7 GB/s läsningar, 3 GB/s skrivningar; 186k IOPS-läsningar, 201 000 IOPS-skrivningar

Processpinning

Processfästning fungerar bra på virtuella datorer i HBv3-serien eftersom vi exponerar det underliggande kiselet i befintligt format för den virtuella gästdatorn. Vi rekommenderar starkt att du fäster processen för optimal prestanda och konsekvens.

MPI-svarstid

MPI-svarstidstestet från OSU microbenchmark-sviten kan köras som det visas. Exempelskript finns på GitHub.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

MPI-bandbredd

MPI-bandbreddstestet från OSU microbenchmark-paketet kan köras enligt nedan. Exempelskript finns på GitHub.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

Mellanox Perftest-paketet har många InfiniBand-tester som svarstid (ib_send_lat) och bandbredd (ib_send_bw). Ett exempelkommando finns nedan.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

Nästa steg