Sdílet prostřednictvím


Výkon virtuálního počítače řady HBv3

Platí pro: ✔️ Virtuální počítače s Windows s Linuxem ✔️ ✔️ – Flexibilní škálovací sady Uniform Scale Sets ✔️

Očekávání výkonu při používání běžných mikrobenchmarků HPC jsou následující:

Úloha HBv3
STREAM Triad 330–350 GB/s (zesíleno až 630 GB/s)
Vysoce výkonný Linpack (HPL) 4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) pro velikost virtuálního počítače s 120 jádry
Latence RDMA a šířka pásma 1,2 mikrosekundy (1 bajt), 192 GB/s (jednosměrná)
FIO na místních discích SSD NVMe (RAID0) 7 GB/s čtení, 3 GB/s zápisy; Čtení 186k IOPS, zápisy IOPS 201k

Připnutí procesu

Připnutí procesu funguje dobře na virtuálních počítačích řady HBv3, protože zveřejňujeme základní silikon, jak je tomu u hostovaného virtuálního počítače. Důrazně doporučujeme připnout proces pro optimální výkon a konzistenci.

Latence MPI

Test latence MPI ze sady mikrobenchmarků OSU je možné spustit, jak je znázorněno. Ukázkové skripty jsou na GitHubu.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

Šířka pásma MPI

Test šířky pásma MPI ze sady microbenchmark OSU je možné spustit podle následujícího postupu. Ukázkové skripty jsou na GitHubu.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

Balíček Mellanox Perftest má mnoho testů InfiniBand, jako je latence (ib_send_lat) a šířka pásma (ib_send_bw). Příklad příkazu je uvedený níže.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

Další kroky