Výkon virtuálního počítače řady HBv3

Článek
01/10/2024

Platí pro: ✔️ Virtuální počítače s Windows s Linuxem ✔️ ✔️ – Flexibilní škálovací sady Uniform Scale Sets ✔️

Očekávání výkonu při používání běžných mikrobenchmarků HPC jsou následující:

Úloha	HBv3
STREAM Triad	330–350 GB/s (zesíleno až 630 GB/s)
Vysoce výkonný Linpack (HPL)	4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) pro velikost virtuálního počítače s 120 jádry
Latence RDMA a šířka pásma	1,2 mikrosekundy (1 bajt), 192 GB/s (jednosměrná)
FIO na místních discích SSD NVMe (RAID0)	7 GB/s čtení, 3 GB/s zápisy; Čtení 186k IOPS, zápisy IOPS 201k

Připnutí procesu

Připnutí procesu funguje dobře na virtuálních počítačích řady HBv3, protože zveřejňujeme základní silikon, jak je tomu u hostovaného virtuálního počítače. Důrazně doporučujeme připnout proces pro optimální výkon a konzistenci.

Latence MPI

Test latence MPI ze sady mikrobenchmarků OSU je možné spustit, jak je znázorněno. Ukázkové skripty jsou na GitHubu.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

Šířka pásma MPI

Test šířky pásma MPI ze sady microbenchmark OSU je možné spustit podle následujícího postupu. Ukázkové skripty jsou na GitHubu.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

Balíček Mellanox Perftest má mnoho testů InfiniBand, jako je latence (ib_send_lat) a šířka pásma (ib_send_bw). Příklad příkazu je uvedený níže.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

Další kroky

Přečtěte si o škálování aplikací MPI.
Projděte si výsledky výkonu a škálovatelnosti aplikací HPC na virtuálních počítačích HBv3 v článku TechCommunity.
Přečtěte si o nejnovějších oznámeních, příkladech úloh PROSTŘEDÍ HPC a výsledcích výkonu na blogech technické komunity Azure Compute.
Přehled architektury vyšší úrovně spouštění úloh PROSTŘEDÍ HPC najdete v tématu Vysokovýkonné výpočetní prostředí (HPC) v Azure.

Sdílet prostřednictvím