Compartilhar via


Visão geral de máquina virtual da série HC

Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows ✔️ Conjuntos de dimensionamento flexíveis ✔️ Conjuntos de dimensionamento uniformes

Maximizar o desempenho do aplicativo HPC em processadores escalonáveis Intel Xeon requer uma abordagem cuidadosa para processar o posicionamento nessa nova arquitetura. Aqui, descrevemos nossa implantação dele em VMs da série HC do Azure para aplicativos HPC. Usaremos o termo "pNUMA" para nos referirmos a um domínio NUMA físico, e "vNUMA" para nos referirmos a um domínio NUMA virtualizado. Da mesma forma, usaremos o termo "pCore" para fazer referência a núcleos de CPU físicos e "vCore" para fazer referência a núcleos de CPU virtualizados.

Fisicamente, um servidor da série HC consiste em duas CPUs de 24 núcleos Intel Xeon Platinum 8168 para um total de 48 núcleos físicos. Cada CPU é um domínio pNUMA único e tem acesso unificado a seis canais de DRAM. As CPUs Intel Xeon Platinum apresentam um cache de L2 4x maior que as gerações anteriores (256 KB/núcleo -> 1 MB/núcleo), também reduzindo o cache de L3 em comparação com as CPUs Intel anteriores (2,5 MB/núcleo -> 1,375 MB/núcleo) .

A topologia acima também é transferida para a configuração de hipervisor da série HC. Para fornecer espaço para o hipervisor do Azure operar sem interferir na VM, reservamos pCores 0-1 e 24-25 (ou seja, os primeiros dois pCores em cada soquete). Em seguida, atribuímos domínios pNUMA a todos os núcleos restantes para a VM. Assim, a VM encontrará:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 núcleos por VM

A VM não tem conhecimento de que os pCores 0-1 e 24-25 não foram disponibilizados a ela. Portanto, ela expõe cada vNUMA como se tivesse, nativamente, 22 núcleos.

As CPUs Intel Xeon Platinum, Gold e Silver também introduzem uma rede de malha 2D em chip para comunicação dentro e fora do soquete da CPU. É altamente recomendável fixar o processo para obter desempenho e consistência ideais. A fixação do processo funcionará em VMs da série HC porque o silício subjacente é exposto no estado em que se encontra à VM convidada.

O diagrama a seguir mostra a separação de núcleos reservados para o hipervisor do Azure e para a VM da série HC.

Separação de núcleos reservados para a VM da série HC e o hipervisor do Azure

Especificações de hardware

Especificações de hardware VM da série HC
Núcleos 44 (HT desabilitado)
CPU Intel Xeon Platinum 8168
Frequência de CPU (não AVX) 3.7 GHz (núcleo único), 2.7-3.4 GHz (todos os núcleos)
Memória 8 GB/núcleo (total de 352)
Disco local SSD de 700 GB
Infiniband EDR Mellanox ConnectX-5 de 100 Gb
Rede Azure Second Gen SmartNIC com 50 GB de Ethernet (40 GB utilizáveis)

Especificações de software

Especificações de software VM da série HC
Tamanho máximo do trabalho de MPI 13.200 núcleos (300 VMs em um único conjunto de dimensionamento de máquinas virtuais com singlePlacementGroup=true)
Suporte a MPI HPC-X, Intel MPI, OpenMPi, MVAPICH2, MPICH, plataforma MPI
Estruturas adicionais UCX, libfabric, PGAS
Suporte do armazenamento do Azure Discos Standard e Premium (máximo de quatro discos)
Suporte do sistema operacional para SRIOV RDMA RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+
Suporte do Orchestrator CycleCloud, Lote, AKS; opções de configuração de cluster

Observação

O suporte oficinal no nível de kernel de AMD começa com RHEL 8.6 e AlmaLinux 8.6, que é um derivado de RHEL.

Próximas etapas