Descrição geral das máquinas virtuais da série HC
Atenção
Este artigo faz referência ao CentOS, uma distribuição Linux que está se aproximando do status de Fim da Vida Útil (EOL). Por favor, considere o seu uso e planeje de acordo. Para obter mais informações, consulte as diretrizes de Fim da Vida Útil do CentOS.
Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes
Maximizar o desempenho do aplicativo HPC nos processadores escaláveis Intel Xeon requer uma abordagem cuidadosa para o posicionamento do processo nesta nova arquitetura. Aqui, descrevemos nossa implementação em VMs da série HC do Azure para aplicativos HPC. Usaremos o termo "pNUMA" para nos referirmos a um domínio NUMA físico, e "vNUMA" para nos referirmos a um domínio NUMA virtualizado. Da mesma forma, usaremos o termo "pCore" para nos referirmos a núcleos de CPU físicos, e "vCore" para nos referirmos a núcleos de CPU virtualizados.
Fisicamente, um servidor da série HC é 2 * 24-core Intel Xeon Platinum 8168 CPUs para um total de 48 núcleos físicos. Cada CPU é um único domínio pNUMA e tem acesso unificado a seis canais de DRAM. As CPUs Intel Xeon Platinum apresentam um cache L2 4x maior do que nas gerações anteriores (256 KB/core -> 1 MB/core), além de reduzir o cache L3 em comparação com as CPUs Intel anteriores (2,5 MB/core -> 1,375 MB/core).
A topologia acima também é transferida para a configuração do hipervisor da série HC. Para fornecer espaço para o hipervisor do Azure operar sem interferir com a VM, reservamos pCores 0-1 e 24-25 (ou seja, os primeiros 2 pCores em cada soquete). Em seguida, atribuímos domínios pNUMA a todos os núcleos restantes à VM. Assim, o VM verá:
(2 vNUMA domains) * (22 cores/vNUMA) = 44
núcleos por VM
A VM não tem conhecimento de que os pCores 0-1 e 24-25 não lhe foram dados. Assim, expõe cada vNUMA como se tivesse nativamente 22 núcleos.
As CPUs Intel Xeon Platinum, Gold e Silver também introduzem uma rede mesh 2D on-die para comunicação dentro e fora do soquete da CPU. Recomendamos vivamente a fixação do processo para um desempenho e consistência ideais. A fixação de processo funcionará em VMs da série HC porque o silício subjacente é exposto como está para a VM convidada.
O diagrama a seguir mostra a segregação de núcleos reservados para o Hipervisor do Azure e a VM da série HC.
Especificações de hardware
Especificações de hardware | VM série HC |
---|---|
Núcleos | 44 (HT desativado) |
CPU | Intel Xeon Platina 8168 |
Freqüência da CPU (não-AVX) | 3,7 GHz (núcleo único), 2,7-3,4 GHz (todos os núcleos) |
Memória | 8 GB/núcleo (352 no total) |
Disco Local | SSD de 700 GB |
Infiniband | 100 Gb EDR Mellanox ConnectX-5 |
Rede | Ethernet de 50 Gb (40 Gb utilizável) SmartNIC de segunda geração do Azure |
Especificações de software
Especificações de software | VM série HC |
---|---|
Tamanho máximo do trabalho MPI | 13200 núcleos (300 VMs em um único conjunto de escala de máquina virtual com singlePlacementGroup=true) |
Suporte MPI | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Plataforma MPI |
Estruturas adicionais | UCX, libfabric, PGAS |
Suporte de armazenamento do Azure | Discos Standard e Premium (máximo 4 discos) |
Suporte de SO para SRIOV RDMA | CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+ |
Suporte ao Orchestrator | CycleCloud, Batch, AKS; Opções de configuração de cluster |
Importante
Este documento faz referência a uma versão de lançamento do Linux que está se aproximando ou em Fim da Vida Útil (EOL). Por favor, considere atualizar para uma versão mais atual.
Próximos passos
- Saiba mais sobre a arquitetura Intel Xeon SP.
- Leia sobre os anúncios mais recentes, exemplos de carga de trabalho HPC e resultados de desempenho nos Blogs da Comunidade de Tecnologia de Computação do Azure.
- Para obter uma exibição de arquitetura de nível superior da execução de cargas de trabalho HPC, consulte Computação de alto desempenho (HPC) no Azure.