Introducción a las máquinas virtuales de la serie HBv2

Precaución

En este artículo se hace referencia a CentOS, una distribución de Linux que está cerca de su estado Final de ciclo vida (EOL). Tenga en cuenta su uso y planifique en consecuencia. Para obtener más información, consulte la Guía de fin de ciclo de vida de CentOS.

Se aplica a: ✔️ Máquinas virtuales Linux ✔️ Máquinas virtuales Windows ✔️ Conjuntos de escalado flexibles ✔️ Conjuntos de escalado uniformes.

Maximizar el rendimiento de la aplicación de proceso de alto rendimiento (HPC) en AMD EPYC requiere un enfoque bien meditado con respecto a la ubicación de los procesos y de la memoria. A continuación se describen la arquitectura de AMD EPYC y nuestra implementación de la misma en Azure para aplicaciones HPC. Utilizamos el término pNUMA para referirnos a un dominio físico de NUMA y vNUMA para referirnos a un dominio virtualizado de NUMA.

Físicamente, un servidor de la serie HBv2 tiene dos CPU EPYC 7V12 con 64 núcleos para cada una, lo que hace un total de 128 núcleos físicos. El multithreading simultáneo (SMT) está deshabilitado en HBv2. Estos 128 núcleos se dividen en 16 secciones (8 por socket), cada una de las cuales contiene 8 núcleos de procesador. Los servidores HBv2 de Azure también tienen la siguiente configuración de BIOS de AMD:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

Como resultado, el servidor se inicia con 4 dominios NUMA (2 por socket), cada uno con un tamaño de 32 núcleos. Cada NUMA tiene acceso directo a 4 canales de DRAM física que funcionan a 3200 MT/s.

Para dejar margen suficiente para que el hipervisor de Azure funcione sin interferir con la máquina virtual, se reservan 8 núcleos físicos por servidor.

Topología de las VM

Nos reservamos estos 8 núcleos de host de hipervisor simétricamente entre ambos sockets de CPU, tomando los primeros 2 núcleos de matrices de complejos de núcleos (CCD) específicas en cada dominio NUMA, con el resto de los núcleos de VM de la serie HBv2. El límite de CCD no es equivalente a un límite de NUMA. En HBv2, se configura un grupo de cuatro (4) CCD consecutivos como dominio NUMA, tanto en el nivel de servidor host como en una VM invitada. Por lo tanto, todos los tamaños de máquina virtual HBv2 exponen 4 dominios NUMA que aparecen en un sistema operativo y una aplicación. 4 dominios NUMA uniformes, cada uno con un número diferente de núcleos según el tamaño de VM HBv2 específico.

El anclaje de procesos funciona en las máquinas virtuales de la serie HBv2 porque exponemos el silicio subyacente tal cual está a la máquina virtual invitada. Se recomienda encarecidamente anclar los procesos para disfrutar de una coherencia y un rendimiento óptimos.

Especificaciones del hardware

Especificaciones del hardware Máquina virtual de la serie HBv2
Núcleos 120 (SMT deshabilitado)
CPU AMD EPYC 7V12
Frecuencia de CPU (no AVX) Aprox. 3,1 GHz (solo + todos los núcleos)
Memoria 4 GB/núcleo (480 GB en total)
Disco local NVMe de 960 GiB (bloque), SSD de 480 GB (archivo de paginación)
Infiniband 200 Gb/s HDR Mellanox ConnectX-6
Red Ethernet a 50 Gb/s (40 Gb/s útiles) SmartNIC de segunda generación de Azure

Especificaciones de software

Especificaciones de software Máquina virtual de la serie HBv2
Tamaño de trabajo de MPI máximo 36000 núcleos (300 máquinas virtuales en un solo conjunto de escalado de máquinas virtuales con singlePlacementGroup=true)
Compatibilidad con MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Otros marcos UCX, libfabric, PGAS
Soporte técnico para Azure Storage Discos Estándar y Premium (un máximo de ocho discos)
Soporte técnico de sistemas operativos para SRIOV RDMA CentOS/RHEL 7.9+, Ubuntu 18.04+, SLES 12 SP5+, WinServer 2016+
Compatibilidad con Orchestrator CycleCloud, Batch, AKS; Opciones de configuración del clúster

Nota

Windows Server 2012 R2 no se admite en HBv2 ni en otras máquinas virtuales con más de 64 núcleos (virtuales o físicos). Para más detalles, consulte el artículo sobre los Sistemas operativos invitados Windows admitidos para Hyper-V en Windows Server.

Pasos siguientes