Descrição geral das máquinas virtuais da série HBv2
Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ Windows Conjuntos ✔️ de escala flexíveis Conjuntos de escala uniformes.
A maximização do desempenho de aplicativos de computação de alto desempenho (HPC) no AMD EPYC requer uma abordagem cuidadosa, memória, localidade e posicionamento do processo. Abaixo, descrevemos a arquitetura AMD EPYC e nossa implementação dela no Azure para aplicativos HPC. Usamos o termo pNUMA para nos referirmos a um domínio NUMA físico e vNUMA para nos referirmos a um domínio NUMA virtualizado.
Fisicamente, um servidor da série HBv2 tem 2 * 64 núcleos EPYC 7V12 CPUs para um total de 128 núcleos físicos. Multithreading simultâneo (SMT) está desativado no HBv2. Esses 128 núcleos são divididos em 16 seções (8 por soquete), cada seção contendo 8 núcleos de processador. Os servidores HBv2 do Azure também executam as seguintes configurações do BIOS AMD:
Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled
Como resultado, o servidor inicializa com 4 domínios NUMA (2 por soquete). Cada domínio tem 32 núcleos de tamanho. Cada NUMA tem acesso direto a 4 canais de DRAM física operando a 3.200 MT / s.
Para fornecer espaço para o hipervisor do Azure operar sem interferir com a VM, reservamos 8 núcleos físicos por servidor.
Topologia de VM
Reservamos esses 8 núcleos de host de hipervisor simetricamente em ambos os soquetes de CPU, pegando os 2 primeiros núcleos de CCDs (Core Complex Dies) específicos em cada domínio NUMA, com os núcleos restantes para a VM da série HBv2. O limite CCD não é equivalente a um limite NUMA. No HBv2, um grupo de quatro CCDs consecutivos (4) é configurado como um domínio NUMA, tanto no nível do servidor host quanto em uma VM convidada. Assim, todos os tamanhos de VM HBv2 expõem 4 domínios NUMA que aparecem para um sistema operacional e aplicativo. 4 domínios NUMA uniformes, cada um com um número diferente de núcleos, dependendo do tamanho específico da VM HBv2.
A fixação de processo funciona em VMs da série HBv2 porque expomos o silício subjacente como está para a VM convidada. Recomendamos vivamente a fixação do processo para um desempenho e consistência ideais.
Especificações de hardware
Especificações de hardware | VM da série HBv2 |
---|---|
Núcleos | 120 (SMT desativado) |
CPU | AMD EPYC 7V12 |
Freqüência da CPU (não-AVX) | ~3,1 GHz (simples + todos os núcleos) |
Memória | 4 GB/núcleo (480 GB no total) |
Disco Local | NVMe de 960 GiB (bloco), SSD de 480 GB (arquivo de página) |
Infiniband | 200 Gb/s HDR Mellanox ConnectX-6 |
Rede | Ethernet de 50 Gb/s (40 Gb/s utilizável) SmartNIC de segunda geração do Azure |
Especificações de software
Especificações de software | VM da série HBv2 |
---|---|
Tamanho máximo do trabalho MPI | 36000 núcleos (300 VMs em um único conjunto de escala de máquina virtual com singlePlacementGroup=true) |
Suporte MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Plataforma MPI |
Estruturas adicionais | UCX, libfabric, PGAS |
Suporte de armazenamento do Azure | Discos Standard e Premium (máximo 8 discos) |
Suporte de SO para SRIOV RDMA | RHEL 7.9+, Ubuntu 18.04+, SLES 12 SP5+, WinServer 2016+ |
Suporte ao Orchestrator | CycleCloud, Batch, AKS; Opções de configuração de cluster |
Nota
O Windows Server 2012 R2 não é suportado no HBv2 e em outras VMs com mais de 64 núcleos (virtuais ou físicos). Para obter mais informações, consulte Sistemas operacionais convidados Windows suportados para Hyper-V no Windows Server.
Próximos passos
- Para obter mais informações sobre a arquitetura AMD EPYC e arquiteturas multichip, consulte o Guia de ajuste de HPC para processadores AMD EPYC.
- Para obter os anúncios mais recentes sobre HPC, exemplos de carga de trabalho e resultados de desempenho, consulte Blogs da Comunidade de Tecnologia de Computação do Azure.
- Para obter uma exibição de arquitetura de nível superior da execução de cargas de trabalho HPC, consulte Computação de alto desempenho (HPC) no Azure.