Descrição geral das máquinas virtuais da série HC
Aplica-se a: ✔️ VMs do Linux VMs ✔️ do Windows Conjuntos ✔️ ✔️ de dimensionamento flexíveis Conjuntos de dimensionamento uniformes
Maximizar o desempenho da aplicação HPC em Processadores Dimensionáveis Intel Xeon requer uma abordagem ponderada para processar a colocação nesta nova arquitetura. Aqui, descrevemos a nossa implementação da mesma em VMs da série HC do Azure para aplicações HPC. Utilizaremos o termo "pNUMA" para fazer referência a um domínio físico de NUMA e "vNUMA" para fazer referência a um domínio NUMA virtualizado. Da mesma forma, vamos utilizar o termo "pCore" para fazer referência a núcleos de CPU físicos e "vCore" para fazer referência a núcleos de CPU virtualizados.
Fisicamente, um servidor da série HC é de 2 * CPUs Intel Xeon Platinum 8168 de 24 núcleos para um total de 48 núcleos físicos. Cada CPU é um único domínio pNUMA e tem acesso unificado a seis canais de DRAM. As CPUs Intel Xeon Platinum apresentam uma cache L2 4x maior do que nas gerações anteriores (256 KB/core -> 1 MB/núcleo), ao mesmo tempo que reduzem a cache L3 em comparação com as CPUs Intel anteriores (2,5 MB/núcleo -> 1,375 MB/núcleo).
A topologia acima passa também para a configuração do hipervisor da série HC. Para fornecer espaço para o hipervisor do Azure funcionar sem interferir com a VM, reservamos pCores 0-1 e 24-25 (ou seja, os primeiros 2 pCores em cada socket). Em seguida, atribuímos domínios pNUMA a todos os núcleos restantes à VM. Assim, a VM verá:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
núcleos por VM
A VM não tem conhecimento de que os pCores 0-1 e 24-25 não lhe foram atribuídos. Assim, expõe cada vNUMA como se tivesse nativamente 22 núcleos.
As CPUs Intel Xeon Platinum, Gold e Silver também introduzem uma rede de malha 2D on-die para comunicação dentro e externa ao socket da CPU. Recomendamos vivamente que processe a afixação para um desempenho e consistência ideais. A afixação de processos funcionará em VMs da série HC porque o silício subjacente é exposto tal como está na VM convidada.
O diagrama seguinte mostra a segregação de núcleos reservados para o Hipervisor do Azure e a VM da série HC.
Especificações de hardware
Especificações de Hardware | VM da série HC |
---|---|
Núcleos | 44 (HT desativado) |
CPU | Intel Xeon Platinum 8168 |
Frequência da CPU (não AVX) | 3,7 GHz (núcleo único), 2,7-3,4 GHz (todos os núcleos) |
Memória | 8 GB/núcleo (total de 352) |
Disco Local | SSD de 700 GB |
Infiniband | 100 Gb EDR Mellanox ConnectX-5 |
Rede | Ethernet de 50 Gb (40 Gb utilizável) SmartNIC de segunda geração do Azure |
Especificações de software
Especificações de Software | VM da série HC |
---|---|
Tamanho Máximo da Tarefa de MPI | 13200 núcleos (300 VMs num único conjunto de dimensionamento de máquinas virtuais com singlePlacementGroup=true) |
Suporte de MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Platform MPI |
Arquiteturas Adicionais | UCX, libfabric, PGAS |
Suporte do Armazenamento do Azure | Discos Standard e Premium (máximo de 4 discos) |
Suporte do SO para RDMA SRIOV | CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+ |
Suporte do Orchestrator | CycleCloud, Batch, AKS; opções de configuração do cluster |
Importante
Este documento faz referência a uma versão de versão do Linux próxima ou em Fim de Vida (EOL). Considere atualizar para uma versão mais atual.
Passos seguintes
- Saiba mais sobre a arquitetura intel Xeon SP.
- Leia sobre os anúncios mais recentes, exemplos de cargas de trabalho HPC e resultados de desempenho nos Blogues da Comunidade Tecnológica de Computação do Azure.
- Para obter uma vista de arquitetura de nível superior da execução de cargas de trabalho HPC, veja Computação de Alto Desempenho (HPC) no Azure.