Introducción a las máquinas virtuales de la serie HC
Se aplica a: ✔️ Máquinas virtuales Linux ✔️ Máquinas virtuales Windows ✔️ Conjuntos de escalado flexibles ✔️ Conjuntos de escalado uniformes
Para poder maximizar el rendimiento de las aplicaciones HPC en procesadores escalables de Intel Xeon, se requiere un enfoque bien meditado a la hora de procesar la selección de la ubicación de esta nueva arquitectura. En este artículo, vamos a tratar de esbozar la implementación de estos procesadores en máquinas virtuales de la serie HC de Azure para aplicaciones HPC. Utilizamos el término “pNUMA” para referirnos a un dominio físico de NUMA y “vNUMA” para referirnos a un dominio virtualizado de NUMA. De igual modo, utilizaremos el término “pCore” para los núcleos de CPU físicos y “vCore” para los núcleos de CPU virtualizados.
Físicamente, un servidor de la serie HC tiene dos CPU Xeon Platinum 8168 con 24 núcleos cada una, lo que hace un total de 48 núcleos físicos. Cada CPU es un único dominio de pNUMA y tiene acceso unificado a seis canales de DRAM. Las CPU Intel Xeon Platinum se caracterizan por tener una caché L2 cuatro veces más grande que las generaciones anteriores (256 KB/núcleo -> 1 MB/núcleo) y por tener una caché L3 más reducida que las anteriores CPU de Intel (2,5 MB/núcleo -> 1375 MB/núcleo).
La topología anterior también es aplicable a la configuración de los hipervisores de la serie HC. Para dejar margen suficiente para que el hipervisor de Azure pueda trabajar sin interferir con la máquina virtual, reservamos los pCores 0-1 y 24-25 (es decir, los dos primeros pCores de cada socket). A continuación, asignamos los dominios de pNUMA y todos los núcleos restantes a la máquina virtual. Por lo tanto, la máquina virtual verá:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
núcleos por máquina virtual
La máquina virtual no sabe que tiene asignados los pCores 0-1 y 24-25. Por tanto, expone cada vNUMA como si tuviera 22 núcleos de forma nativa.
Las CPU Intel Xeon Platinum, Gold y Silver también cuenta con una red de malla 2D en el mismo chip para realizar las comunicaciones internas y externas con el socket de la CPU. Se recomienda encarecidamente anclar los procesos para disfrutar de una coherencia y un rendimiento óptimos. En anclaje de procesos funcionará en las máquinas virtuales de la serie HC porque el silicio subyacente se expone tal cual está a la máquina virtual invitada.
En el siguiente diagrama se muestra la segregación de los núcleos reservados para el hipervisor de Azure y la máquina virtual de la serie HC.
Especificaciones del hardware
Especificaciones del hardware | Máquina virtual de la serie HC |
---|---|
Núcleos | 44 (HT deshabilitado) |
CPU | Intel Xeon Platinum 8168 |
Frecuencia de CPU (no AVX) | 3,7 GHz (un solo núcleo), 2,7-3,4 GHz (todos los núcleos) |
Memoria | 8 GB/núcleo (total: 352) |
Disco local | SSD de 700 GB |
Infiniband | EDR de 100 Gb Mellanox ConnectX-5 |
Red | Ethernet de 50 Gb (40 Gb útiles) SmartNIC de segunda generación de Azure |
Especificaciones de software
Especificaciones de software | Máquina virtual de la serie HC |
---|---|
Tamaño de trabajo de MPI máximo | 13200 núcleos (300 máquinas virtuales en un solo conjunto de escalado de máquinas virtuales con singlePlacementGroup=true) |
Compatibilidad con MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI |
Otros marcos | UCX, libfabric, PGAS |
Soporte técnico para Azure Storage | Discos estándar y premium (cuatro discos como máximo) |
Soporte técnico de sistemas operativos para SRIOV RDMA | RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+ |
Compatibilidad con Orchestrator | CycleCloud, Batch, AKS; Opciones de configuración del clúster |
Nota:
La compatibilidad oficial de nivel de kernel de AMD comienza con RHEL 8.6 y AlmaLinux 8.6, que es un derivado de RHEL.
Pasos siguientes
- Para más información, consulte la arquitectura de SP de Intel Xeon.
- En los blogs de Azure Compute Community Tech, encontrará los anuncios más recientes, ejemplos de la carga de trabajo HPC y resultados de HPC.
- Si desea una visión general de la arquitectura de la ejecución de cargas de trabajo de HPC, consulte Informática de alto rendimiento (HPC) en Azure.