Comparteix a través de


Rendimiento de las máquinas virtuales de la serie HBv3

Se aplica a: ✔️ Máquinas virtuales Linux ✔️ Máquinas virtuales Windows ✔️ Conjuntos de escalado flexibles ✔️ Conjuntos de escalado uniformes

Las expectativas de rendimiento que usan micropuntos de referencia de HPC comunes son las siguientes:

Carga de trabajo HBv3
STREAM Triad 330-350 GB/s (ampliado hasta 630 GB/s)
High-Performance Linpack (HPL) 4 TF (Rpeak, FP64), 8 TF (Rpeak, FP32) para el tamaño de máquina virtual de 120 núcleos
Latencia y ancho de banda de RDMA 1,2 microsegundos (1 byte), 192 GB/s (unidireccional)
FIO en SSD de NVMe local (RAID0) 7 GB/s de lecturas, 3 GB/s de escrituras; lecturas de IOPS de 186k, escrituras de IOPS de 201k

Anclaje de procesos

El anclaje de procesos funciona bien en las VM de la serie HBv3 porque exponemos el silicio subyacente tal cual está a la VM invitada. Se recomienda encarecidamente anclar los procesos para disfrutar de una coherencia y un rendimiento óptimos.

Latencia de MPI

Se puede ejecutar la prueba de latencia de MPI del conjunto de pruebas de micropuntos de referencia OSU según se muestra. Los scripts de ejemplo se encuentran en GitHub.

./bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./osu_latency

Ancho de banda de MPI

La prueba de ancho de banda de MPI del conjunto de pruebas de micropuntos de referencia OSU se puede ejecutar según se indica a continuación. Los scripts de ejemplo se encuentran en GitHub.

./mvapich2-2.3.install/bin/mpirun_rsh -np 2 -hostfile ~/hostfile MV2_CPU_MAPPING=[INSERT CORE #] ./mvapich2-2.3/osu_benchmarks/mpi/pt2pt/osu_bw

Mellanox Perftest

El paquete Mellanox Perftest tiene muchas pruebas de InfiniBand, como la de latencia (ib_send_lat) y la de ancho de banda (ib_send_bw). El siguiente es un ejemplo de comando.

numactl --physcpubind=[INSERT CORE #]  ib_send_lat -a

Pasos siguientes