Wydajność maszyny wirtualnej serii HBv3
Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows ✔️ — elastyczne zestawy ✔️ skalowania
Oczekiwania dotyczące wydajności przy użyciu typowych mikrobenchmarków HPC są następujące:
Obciążenie | HBv3 |
---|---|
STREAM Triad | 330–350 GB/s (wzmocnione do 630 GB/s) |
Linpack o wysokiej wydajności (HPL) | 4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) dla 120-rdzeniowej maszyny wirtualnej |
Opóźnienie i przepustowość RDMA | 1,2 mikrosekundy (1 bajt), 192 GB/s (jednokierunkowe) |
FiO na lokalnych dyskach SSD NVMe (RAID0) | Odczyty 7 GB/s, zapisy 3 GB/s; Odczyty operacji we/wy na sekundę 186 tys. operacji we/wy na sekundę 201k |
Przypinanie procesu
Przypinanie procesów działa dobrze na maszynach wirtualnych serii HBv3, ponieważ uwidaczniamy bazowy krzem jako maszynę wirtualną gościa. Zdecydowanie zalecamy przypinanie procesów w celu uzyskania optymalnej wydajności i spójności.
Opóźnienie MPI
Test opóźnienia MPI z zestawu mikrobenchmarku OSU można wykonać, jak pokazano. Przykładowe skrypty znajdują się w witrynie GitHub.
./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency
Przepustowość MPI
Test przepustowości MPI z zestawu mikrobenchmark jednostek organizacyjnych można wykonać na poniższe. Przykładowe skrypty znajdują się w witrynie GitHub.
./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw
Mellanox Perftest
Pakiet Mellanox Perftest zawiera wiele testów InfiniBand, takich jak opóźnienie (ib_send_lat) i przepustowość (ib_send_bw). Poniżej znajduje się przykładowe polecenie.
numactl --physcpubind=[INSERT CORE #] ib_send_lat -a
Następne kroki
- Dowiedz się więcej o skalowaniu aplikacji MPI.
- Zapoznaj się z wynikami wydajności i skalowalności aplikacji HPC na maszynach wirtualnych HBv3 w artykule TechCommunity.
- Przeczytaj o najnowszych ogłoszeniach, przykładach obciążeń HPC i wynikach wydajności na blogach społeczności technicznej usługi Azure Compute.
- Aby zapoznać się z widokiem architektury wyższego poziomu na potrzeby uruchamiania obciążeń HPC, zobacz Obliczenia o wysokiej wydajności (HPC) na platformie Azure.