Wydajność maszyny wirtualnej serii HBv3

Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows ✔️ — elastyczne zestawy ✔️ skalowania

Oczekiwania dotyczące wydajności przy użyciu typowych mikrobenchmarków HPC są następujące:

Obciążenie HBv3
STREAM Triad 330–350 GB/s (wzmocnione do 630 GB/s)
Linpack o wysokiej wydajności (HPL) 4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) dla 120-rdzeniowej maszyny wirtualnej
Opóźnienie i przepustowość RDMA 1,2 mikrosekundy (1 bajt), 192 GB/s (jednokierunkowe)
FiO na lokalnych dyskach SSD NVMe (RAID0) Odczyty 7 GB/s, zapisy 3 GB/s; Odczyty operacji we/wy na sekundę 186 tys. operacji we/wy na sekundę 201k

Przypinanie procesu

Przypinanie procesów działa dobrze na maszynach wirtualnych serii HBv3, ponieważ uwidaczniamy bazowy krzem jako maszynę wirtualną gościa. Zdecydowanie zalecamy przypinanie procesów w celu uzyskania optymalnej wydajności i spójności.

Opóźnienie MPI

Test opóźnienia MPI z zestawu mikrobenchmarku OSU można wykonać, jak pokazano. Przykładowe skrypty znajdują się w witrynie GitHub.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

Przepustowość MPI

Test przepustowości MPI z zestawu mikrobenchmark jednostek organizacyjnych można wykonać na poniższe. Przykładowe skrypty znajdują się w witrynie GitHub.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

Pakiet Mellanox Perftest zawiera wiele testów InfiniBand, takich jak opóźnienie (ib_send_lat) i przepustowość (ib_send_bw). Poniżej znajduje się przykładowe polecenie.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

Następne kroki

  • Dowiedz się więcej o skalowaniu aplikacji MPI.
  • Zapoznaj się z wynikami wydajności i skalowalności aplikacji HPC na maszynach wirtualnych HBv3 w artykule TechCommunity.
  • Przeczytaj o najnowszych ogłoszeniach, przykładach obciążeń HPC i wynikach wydajności na blogach społeczności technicznej usługi Azure Compute.
  • Aby zapoznać się z widokiem architektury wyższego poziomu na potrzeby uruchamiania obciążeń HPC, zobacz Obliczenia o wysokiej wydajności (HPC) na platformie Azure.