Descrição geral das máquinas virtuais da série HC

Aplica-se a: ✔️ VMs do Linux VMs ✔️ do Windows Conjuntos ✔️ ✔️ de dimensionamento flexíveis Conjuntos de dimensionamento uniformes

Maximizar o desempenho da aplicação HPC em Processadores Dimensionáveis Intel Xeon requer uma abordagem ponderada para processar a colocação nesta nova arquitetura. Aqui, descrevemos a nossa implementação da mesma em VMs da série HC do Azure para aplicações HPC. Utilizaremos o termo "pNUMA" para fazer referência a um domínio físico de NUMA e "vNUMA" para fazer referência a um domínio NUMA virtualizado. Da mesma forma, vamos utilizar o termo "pCore" para fazer referência a núcleos de CPU físicos e "vCore" para fazer referência a núcleos de CPU virtualizados.

Fisicamente, um servidor da série HC é de 2 * CPUs Intel Xeon Platinum 8168 de 24 núcleos para um total de 48 núcleos físicos. Cada CPU é um único domínio pNUMA e tem acesso unificado a seis canais de DRAM. As CPUs Intel Xeon Platinum apresentam uma cache L2 4x maior do que nas gerações anteriores (256 KB/core -> 1 MB/núcleo), ao mesmo tempo que reduzem a cache L3 em comparação com as CPUs Intel anteriores (2,5 MB/núcleo -> 1,375 MB/núcleo).

A topologia acima passa também para a configuração do hipervisor da série HC. Para fornecer espaço para o hipervisor do Azure funcionar sem interferir com a VM, reservamos pCores 0-1 e 24-25 (ou seja, os primeiros 2 pCores em cada socket). Em seguida, atribuímos domínios pNUMA a todos os núcleos restantes à VM. Assim, a VM verá:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 núcleos por VM

A VM não tem conhecimento de que os pCores 0-1 e 24-25 não lhe foram atribuídos. Assim, expõe cada vNUMA como se tivesse nativamente 22 núcleos.

As CPUs Intel Xeon Platinum, Gold e Silver também introduzem uma rede de malha 2D on-die para comunicação dentro e externa ao socket da CPU. Recomendamos vivamente que processe a afixação para um desempenho e consistência ideais. A afixação de processos funcionará em VMs da série HC porque o silício subjacente é exposto tal como está na VM convidada.

O diagrama seguinte mostra a segregação de núcleos reservados para o Hipervisor do Azure e a VM da série HC.

Segregação de núcleos reservados para a VM do Hypervisor do Azure e da série HC

Especificações de hardware

Especificações de Hardware VM da série HC
Núcleos 44 (HT desativado)
CPU Intel Xeon Platinum 8168
Frequência da CPU (não AVX) 3,7 GHz (núcleo único), 2,7-3,4 GHz (todos os núcleos)
Memória 8 GB/núcleo (total de 352)
Disco Local SSD de 700 GB
Infiniband 100 Gb EDR Mellanox ConnectX-5
Rede Ethernet de 50 Gb (40 Gb utilizável) SmartNIC de segunda geração do Azure

Especificações de software

Especificações de Software VM da série HC
Tamanho Máximo da Tarefa de MPI 13200 núcleos (300 VMs num único conjunto de dimensionamento de máquinas virtuais com singlePlacementGroup=true)
Suporte de MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI
Arquiteturas Adicionais UCX, libfabric, PGAS
Suporte do Armazenamento do Azure Discos Standard e Premium (máximo de 4 discos)
Suporte do SO para RDMA SRIOV CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Suporte do Orchestrator CycleCloud, Batch, AKS; opções de configuração do cluster

Importante

Este documento faz referência a uma versão de versão do Linux próxima ou em Fim de Vida (EOL). Considere atualizar para uma versão mais atual.

Passos seguintes