Partilhar via


Desempenho da máquina virtual da série HX

Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes

As expectativas de desempenho que utilizam microparâmetros de HPC comuns são as seguintes:

Carga de trabalho HISTÓRIA
Tríade STREAM 750-780GB/s de DDR5, até 5,7 TB/s de largura de banda de cache 3D-V
Linpack de alto desempenho (HPL) Até 7,6 TF (Rpeak, FP64) para tamanho de VM de 144 núcleos
Latência RDMA & largura de banda < 2 microssegundos (1 byte), 400 Gb/s (unidirecional)
FIO em SSDs NVMe locais (RAID0) 12 GB/s de leitura, 7 GB/s de gravação; 186k IOPS lê, 201k IOPS grava

Teste de largura de banda de memória

O teste de memória STREAM pode ser executado usando os scripts neste repositório GitHub.

git clone https://github.com/Azure/woc-benchmarking 
cd woc-benchmarking/apps/hpc/stream/ 
sh build_stream.sh 
sh stream_run_script.sh $PWD “hbrs_v4” 

Teste de desempenho de computação

O benchmark HPL pode ser executado usando o script neste repositório GitHub.

git clone https://github.com/Azure/woc-benchmarking 
cd woc-benchmarking/apps/hpc/hpl 
sh hpl_build_script.sh 
sh hpl_run_scr_hbv4.sh $PWD 

Latência do IPM

O teste de latência MPI do conjunto de microbenchmark OSU pode ser executado como mostrado. Os scripts de exemplo estão no GitHub.

module load mpi/hpcx 
mpirun -np 2 --host $src,$dst --map-by node -x LD_LIBRARY_PATH $HPCX_OSU_DIR/osu_latency

Largura de banda MPI

O teste de largura de banda MPI do conjunto de microbenchmark OSU pode ser executado conforme mostrado. Os scripts de exemplo estão no GitHub.

module load mpi/hpcx 
mpirun -np 2 --host $src,$dst --map-by node -x LD_LIBRARY_PATH $HPCX_OSU_DIR/osu_bw

[! NOTA] Defina source(src) e destination(dst).

Mellanox Perftest

O pacote Mellanox Perftest tem muitos testes InfiniBand, como latência (ib_send_lat) e largura de banda (ib_send_bw). Um comando de exemplo é mostrado.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

[! NOTA] A afinidade do nó NUMA para InfiniBand NIC é NUMA0.

Próximos passos

  • Saiba mais sobre como dimensionar aplicativos MPI.
  • Analise os resultados de desempenho e escalabilidade de aplicativos HPC nas VMs HX no artigo TechCommunity.
  • Leia sobre os anúncios mais recentes, exemplos de carga de trabalho de HPC e resultados de desempenho no Hub da Comunidade Microsoft HPC do Azure.
  • Para obter uma exibição de arquitetura de nível mais alto da execução de cargas de trabalho HPC, consulte Computação de alto desempenho (HPC) no Azure.