Monitorando o desempenho da máquina virtual da série HBv3

Artigo
10/15/2024

Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows ✔️ Conjuntos de dimensionamento flexíveis ✔️ Conjuntos de dimensionamento uniformes

As expectativas de desempenho usando o HPC comum são as seguintes:

Carga de trabalho	HBv3
STREAM Triad	330-350 GB/s (amplificado até 630 GB/s)
High-Performance Linpack (HPL)	4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) para o tamanho de VM de 120 núcleos
Largura de banda e latência de RDMA	1,2 microssegundos (1 byte), 192 GB/s (unidirecional)
FIO em SSDs de NVMe local (RAID0)	Leituras de 7 GB/s, gravações de 3 GB/s; leituras de IOPS de 186k, gravações de IOPS de 201k

Fixação de processo

A fixação de processo funciona bem em VMs de série HBv3, pois expomos o silício subjacente como está para a VM convidada. É altamente recomendável fixar o processo para desempenho e consistência ideais.

Latência de MPI

O teste de latência de MPI do OSU Microbenchmark Suite pode ser executado conforme mostrado. Os scripts de exemplo estão no GitHub.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

Largura de banda de MPI

O teste de largura de banda de MPI do OSU Microbenchmark Suite pode ser executado conforme mostrado abaixo. Os scripts de exemplo estão no GitHub.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

O pacote Mellanox Perftest tem muitos testes de InfiniBand, como latência (ib_send_lat) e largura de banda (ib_send_bw). Um comando de exemplo é mostrado abaixo.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

Próximas etapas

Saiba mais sobre colocação em escala de aplicativos MPI.
Examine os resultados de desempenho e escalabilidade dos aplicativos HPC nas VMs HBv3 no artigo da TechCommunity.
Leia informações sobre comunicados mais recentes, exemplos de cargas de trabalho de HPC e resultados de desempenho nos Blogs do programa Tech Groups da Computação do Azure.
Para obter uma visão de nível superior da arquitetura de execução de cargas de trabalho de HPC, confira HPC (computação de alto desempenho) no Azure.

Compartilhar via