Descrição geral das máquinas virtuais da série HBv2

Atenção

Este artigo faz referência ao CentOS, uma distribuição Linux que está se aproximando do status de Fim da Vida Útil (EOL). Por favor, considere o seu uso e planeje de acordo. Para obter mais informações, consulte as diretrizes de Fim da Vida Útil do CentOS.

Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ Windows Conjuntos ✔️ de escala flexíveis Conjuntos de escala uniformes.

A maximização do desempenho de aplicativos de computação de alto desempenho (HPC) no AMD EPYC requer uma abordagem cuidadosa, memória, localidade e posicionamento do processo. Abaixo, descrevemos a arquitetura AMD EPYC e nossa implementação dela no Azure para aplicativos HPC. Usamos o termo pNUMA para nos referirmos a um domínio NUMA físico e vNUMA para nos referirmos a um domínio NUMA virtualizado.

Fisicamente, um servidor da série HBv2 tem 2 * 64 núcleos EPYC 7V12 CPUs para um total de 128 núcleos físicos. Multithreading simultâneo (SMT) está desativado no HBv2. Esses 128 núcleos são divididos em 16 seções (8 por soquete), cada seção contendo 8 núcleos de processador. Os servidores HBv2 do Azure também executam as seguintes configurações do BIOS AMD:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

Como resultado, o servidor inicializa com 4 domínios NUMA (2 por soquete) cada um com 32 núcleos de tamanho. Cada NUMA tem acesso direto a 4 canais de DRAM física operando a 3200 MT / s.

Para fornecer espaço para o hipervisor do Azure operar sem interferir com a VM, reservamos 8 núcleos físicos por servidor.

Topologia de VM

Reservamos esses 8 núcleos de host de hipervisor simetricamente em ambos os soquetes de CPU, pegando os 2 primeiros núcleos de CCDs (Core Complex Dies) específicos em cada domínio NUMA, com os núcleos restantes para a VM da série HBv2. O limite CCD não é equivalente a um limite NUMA. No HBv2, um grupo de quatro CCDs consecutivos (4) é configurado como um domínio NUMA, tanto no nível do servidor host quanto em uma VM convidada. Assim, todos os tamanhos de VM HBv2 expõem 4 domínios NUMA que aparecem para um sistema operacional e aplicativo. 4 domínios NUMA uniformes, cada um com um número diferente de núcleos, dependendo do tamanho específico da VM HBv2.

A fixação de processo funciona em VMs da série HBv2 porque expomos o silício subjacente como está para a VM convidada. Recomendamos vivamente a fixação do processo para um desempenho e consistência ideais.

Especificações de hardware

Especificações de hardware VM da série HBv2
Núcleos 120 (SMT desativado)
CPU AMD EPYC 7V12
Freqüência da CPU (não-AVX) ~3,1 GHz (simples + todos os núcleos)
Memória 4 GB/núcleo (480 GB no total)
Disco Local NVMe de 960 GiB (bloco), SSD de 480 GB (arquivo de página)
Infiniband 200 Gb/s HDR Mellanox ConnectX-6
Rede Ethernet de 50 Gb/s (40 Gb/s utilizável) SmartNIC de segunda geração do Azure

Especificações de software

Especificações de software VM da série HBv2
Tamanho máximo do trabalho MPI 36000 núcleos (300 VMs em um único conjunto de escala de máquina virtual com singlePlacementGroup=true)
Suporte MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Plataforma MPI
Estruturas adicionais UCX, libfabric, PGAS
Suporte de armazenamento do Azure Discos Standard e Premium (máximo 8 discos)
Suporte de SO para SRIOV RDMA CentOS/RHEL 7.9+, Ubuntu 18.04+, SLES 12 SP5+, WinServer 2016+
Suporte ao Orchestrator CycleCloud, Batch, AKS; Opções de configuração de cluster

Nota

O Windows Server 2012 R2 não é suportado no HBv2 e em outras VMs com mais de 64 núcleos (virtuais ou físicos). Para obter mais informações, consulte Sistemas operacionais convidados Windows suportados para Hyper-V no Windows Server.

Próximos passos