Visão geral de máquina virtual da série HC
Cuidado
Este artigo faz referência ao CentOS, uma distribuição do Linux que está se aproximando do status de EOL (fim da vida útil). Considere seu uso e planeje adequadamente. Para obter mais informações, veja as Orientações sobre fim da vida útil do CentOS.
Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows ✔️ Conjuntos de dimensionamento flexíveis ✔️ Conjuntos de dimensionamento uniformes
Maximizar o desempenho do aplicativo HPC em processadores escalonáveis Intel Xeon requer uma abordagem cuidadosa para processar o posicionamento nessa nova arquitetura. Aqui, descrevemos nossa implantação dele em VMs da série HC do Azure para aplicativos HPC. Usaremos o termo "pNUMA" para fazer referência a um domínio NUMA físico e "vNUMA" para fazer referência a um domínio NUMA virtualizado. Da mesma forma, usaremos o termo "pCore" para fazer referência a núcleos de CPU físicos e "vCore" para fazer referência a núcleos de CPU virtualizados.
Fisicamente, um servidor da série HC consiste em duas CPUs de 24 núcleos Intel Xeon Platinum 8168 para um total de 48 núcleos físicos. Cada CPU é um domínio pNUMA único e tem acesso unificado a seis canais de DRAM. As CPUs Intel Xeon Platinum apresentam um cache de L2 4x maior que as gerações anteriores (256 KB/núcleo -> 1 MB/núcleo), também reduzindo o cache de L3 em comparação com as CPUs Intel anteriores (2,5 MB/núcleo -> 1,375 MB/núcleo) .
A topologia acima também é transferida para a configuração de hipervisor da série HC. Para fornecer espaço para o hipervisor do Azure operar sem interferir na VM, reservamos pCores 0-1 e 24-25 (ou seja, os primeiros dois pCores em cada soquete). Em seguida, atribuímos domínios pNUMA a todos os núcleos restantes para a VM. Assim, a VM encontrará:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
núcleos por VM
A VM não tem conhecimento de que os pCores 0-1 e 24-25 não foram disponibilizados a ela. Portanto, ela expõe cada vNUMA como se tivesse, nativamente, 22 núcleos.
As CPUs Intel Xeon Platinum, Gold e Silver também introduzem uma rede de malha 2D em chip para comunicação dentro e fora do soquete da CPU. É altamente recomendável fixar o processo para obter desempenho e consistência ideais. A fixação do processo funcionará em VMs da série HC porque o silício subjacente é exposto no estado em que se encontra à VM convidada.
O diagrama a seguir mostra a separação de núcleos reservados para o hipervisor do Azure e para a VM da série HC.
Especificações de hardware
Especificações de hardware | VM da série HC |
---|---|
Núcleos | 44 (HT desabilitado) |
CPU | Intel Xeon Platinum 8168 |
Frequência de CPU (não AVX) | 3.7 GHz (núcleo único), 2.7-3.4 GHz (todos os núcleos) |
Memória | 8 GB/núcleo (total de 352) |
Disco local | SSD de 700 GB |
Infiniband | EDR Mellanox ConnectX-5 de 100 Gb |
Rede | Azure Second Gen SmartNIC com 50 GB de Ethernet (40 GB utilizáveis) |
Especificações de software
Especificações de software | VM da série HC |
---|---|
Tamanho máximo do trabalho de MPI | 13.200 núcleos (300 VMs em um único conjunto de dimensionamento de máquinas virtuais com singlePlacementGroup=true) |
Suporte a MPI | HPC-X, Intel MPI, OpenMPi, MVAPICH2, MPICH, plataforma MPI |
Estruturas adicionais | UCX, libfabric, PGAS |
Suporte do armazenamento do Azure | Discos Standard e Premium (máximo de quatro discos) |
Suporte do sistema operacional para SRIOV RDMA | CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+ |
Suporte do Orchestrator | CycleCloud, Lote, AKS; opções de configuração de cluster |
Importante
Este documento faz referência a uma versão de lançamento do Linux que está se aproximando ou em Fim da Vida Útil(EOL). Considere atualizar para uma versão mais recente.
Próximas etapas
- Saiba mais sobre a Arquitetura do Intel Xeon SP.
- Leia informações sobre comunicados mais recentes, exemplos de cargas de trabalho de HPC e resultados de desempenho nos Blogs do programa Tech Groups da Computação do Azure.
- Para obter uma visão de nível superior da arquitetura de execução de cargas de trabalho de HPC, confira HPC (computação de alto desempenho) no Azure.