Rendimiento de las máquinas virtuales de la serie HBv3

Article
10/15/2024

Se aplica a: ✔️ Máquinas virtuales Linux ✔️ Máquinas virtuales Windows ✔️ Conjuntos de escalado flexibles ✔️ Conjuntos de escalado uniformes

Las expectativas de rendimiento que usan micropuntos de referencia de HPC comunes son las siguientes:

Carga de trabajo	HBv3
STREAM Triad	330-350 GB/s (ampliado hasta 630 GB/s)
High-Performance Linpack (HPL)	4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) para el tamaño de máquina virtual de 120 núcleos
Latencia y ancho de banda de RDMA	1,2 microsegundos (1 byte), 192 GB/s (unidireccional)
FIO en SSD de NVMe local (RAID0)	7 GB/s de lecturas, 3 GB/s de escrituras; lecturas de IOPS de 186k, escrituras de IOPS de 201k

Anclaje de procesos

El anclaje de procesos funciona bien en las VM de la serie HBv3 porque exponemos el silicio subyacente tal cual está a la VM invitada. Se recomienda encarecidamente anclar los procesos para disfrutar de una coherencia y un rendimiento óptimos.

Latencia de MPI

Se puede ejecutar la prueba de latencia de MPI del conjunto de pruebas de micropuntos de referencia OSU según se muestra. Los scripts de ejemplo se encuentran en GitHub.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

Ancho de banda de MPI

La prueba de ancho de banda de MPI del conjunto de pruebas de micropuntos de referencia OSU se puede ejecutar según se indica a continuación. Los scripts de ejemplo se encuentran en GitHub.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

El paquete Mellanox Perftest tiene muchas pruebas de InfiniBand, como la de latencia (ib_send_lat) y la de ancho de banda (ib_send_bw). El siguiente es un ejemplo de comando.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

Pasos siguientes

Más información sobre el escalado de aplicaciones MPI.
Revise los resultados de rendimiento y escalabilidad de las aplicaciones HPC en las VM HBv3 en el artículo de TechCommunity.
En los blogs de Azure Compute Community Tech, encontrará los anuncios más recientes, ejemplos de la carga de trabajo HPC y resultados de HPC.
Si quiere una visión general de la arquitectura de la ejecución de cargas de trabajo de HPC, consulte Informática de alto rendimiento (HPC) en Azure.

Comparteix a través de