Visão geral de máquina virtual da série HC
Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows ✔️ Conjuntos de dimensionamento flexíveis ✔️ Conjuntos de dimensionamento uniformes
Maximizar o desempenho do aplicativo HPC em processadores escalonáveis Intel Xeon requer uma abordagem cuidadosa para processar o posicionamento nessa nova arquitetura. Aqui, descrevemos nossa implantação dele em VMs da série HC do Azure para aplicativos HPC. Usaremos o termo "pNUMA" para nos referirmos a um domínio NUMA físico, e "vNUMA" para nos referirmos a um domínio NUMA virtualizado. Da mesma forma, usaremos o termo "pCore" para fazer referência a núcleos de CPU físicos e "vCore" para fazer referência a núcleos de CPU virtualizados.
Fisicamente, um servidor da série HC consiste em duas CPUs de 24 núcleos Intel Xeon Platinum 8168 para um total de 48 núcleos físicos. Cada CPU é um domínio pNUMA único e tem acesso unificado a seis canais de DRAM. As CPUs Intel Xeon Platinum apresentam um cache de L2 4x maior que as gerações anteriores (256 KB/núcleo -> 1 MB/núcleo), também reduzindo o cache de L3 em comparação com as CPUs Intel anteriores (2,5 MB/núcleo -> 1,375 MB/núcleo) .
A topologia acima também é transferida para a configuração de hipervisor da série HC. Para fornecer espaço para o hipervisor do Azure operar sem interferir na VM, reservamos pCores 0-1 e 24-25 (ou seja, os primeiros dois pCores em cada soquete). Em seguida, atribuímos domínios pNUMA a todos os núcleos restantes para a VM. Assim, a VM encontrará:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
núcleos por VM
A VM não tem conhecimento de que os pCores 0-1 e 24-25 não foram disponibilizados a ela. Portanto, ela expõe cada vNUMA como se tivesse, nativamente, 22 núcleos.
As CPUs Intel Xeon Platinum, Gold e Silver também introduzem uma rede de malha 2D em chip para comunicação dentro e fora do soquete da CPU. É altamente recomendável fixar o processo para obter desempenho e consistência ideais. A fixação do processo funcionará em VMs da série HC porque o silício subjacente é exposto no estado em que se encontra à VM convidada.
O diagrama a seguir mostra a separação de núcleos reservados para o hipervisor do Azure e para a VM da série HC.
Especificações de hardware
Especificações de hardware | VM da série HC |
---|---|
Núcleos | 44 (HT desabilitado) |
CPU | Intel Xeon Platinum 8168 |
Frequência de CPU (não AVX) | 3.7 GHz (núcleo único), 2.7-3.4 GHz (todos os núcleos) |
Memória | 8 GB/núcleo (total de 352) |
Disco local | SSD de 700 GB |
Infiniband | EDR Mellanox ConnectX-5 de 100 Gb |
Rede | Azure Second Gen SmartNIC com 50 GB de Ethernet (40 GB utilizáveis) |
Especificações de software
Especificações de software | VM da série HC |
---|---|
Tamanho máximo do trabalho de MPI | 13.200 núcleos (300 VMs em um único conjunto de dimensionamento de máquinas virtuais com singlePlacementGroup=true) |
Suporte a MPI | HPC-X, Intel MPI, OpenMPi, MVAPICH2, MPICH, plataforma MPI |
Estruturas adicionais | UCX, libfabric, PGAS |
Suporte do armazenamento do Azure | Discos Standard e Premium (máximo de quatro discos) |
Suporte do sistema operacional para SRIOV RDMA | RHEL 7.6+, Ubuntu 20.04+, SLES 15.4, WinServer 2016+ |
Suporte do Orchestrator | CycleCloud, Lote, AKS; opções de configuração de cluster |
Observação
O suporte oficinal no nível de kernel de AMD começa com RHEL 8.6 e AlmaLinux 8.6, que é um derivado de RHEL.
Próximas etapas
- Saiba mais sobre a Arquitetura do Intel Xeon SP.
- Leia informações sobre comunicados mais recentes, exemplos de cargas de trabalho de HPC e resultados de desempenho nos Blogs do programa Tech Groups da Computação do Azure.
- Para obter uma visão de nível superior da arquitetura de execução de cargas de trabalho de HPC, confira HPC (computação de alto desempenho) no Azure.