Descrição geral das máquinas virtuais da série HC

Atenção

Este artigo faz referência ao CentOS, uma distribuição Linux que está se aproximando do status de Fim da Vida Útil (EOL). Por favor, considere o seu uso e planejamento de acordo. Para obter mais informações, consulte as diretrizes de Fim da Vida Útil do CentOS.

Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes

Maximizar o desempenho do aplicativo HPC nos processadores escaláveis Intel Xeon requer uma abordagem cuidadosa para o posicionamento do processo nesta nova arquitetura. Aqui, descrevemos nossa implementação em VMs da série HC do Azure para aplicativos HPC. Usaremos o termo "pNUMA" para nos referirmos a um domínio NUMA físico, e "vNUMA" para nos referirmos a um domínio NUMA virtualizado. Da mesma forma, usaremos o termo "pCore" para nos referirmos a núcleos de CPU físicos, e "vCore" para nos referirmos a núcleos de CPU virtualizados.

Fisicamente, um servidor da série HC é 2 * 24-core Intel Xeon Platinum 8168 CPUs para um total de 48 núcleos físicos. Cada CPU é um único domínio pNUMA e tem acesso unificado a seis canais de DRAM. As CPUs Intel Xeon Platinum apresentam um cache L2 4x maior do que nas gerações anteriores (256 KB/core -> 1 MB/core), além de reduzir o cache L3 em comparação com as CPUs Intel anteriores (2,5 MB/core -> 1,375 MB/core).

A topologia acima também é transferida para a configuração do hipervisor da série HC. Para fornecer espaço para o hipervisor do Azure operar sem interferir com a VM, reservamos pCores 0-1 e 24-25 (ou seja, os primeiros 2 pCores em cada soquete). Em seguida, atribuímos domínios pNUMA a todos os núcleos restantes à VM. Assim, o VM verá:

(2 vNUMA domains) * (22 cores/vNUMA) = 44 núcleos por VM

A VM não tem conhecimento de que os pCores 0-1 e 24-25 não lhe foram dados. Assim, expõe cada vNUMA como se tivesse nativamente 22 núcleos.

As CPUs Intel Xeon Platinum, Gold e Silver também introduzem uma rede mesh 2D on-die para comunicação dentro e fora do soquete da CPU. Recomendamos vivamente a fixação do processo para um desempenho e consistência ideais. A fixação de processo funcionará em VMs da série HC porque o silício subjacente é exposto como está para a VM convidada.

O diagrama a seguir mostra a segregação de núcleos reservados para o Hipervisor do Azure e a VM da série HC.

Segregação de núcleos reservados para o Hipervisor do Azure e a VM da série HC

Especificações de hardware

Especificações de hardware VM série HC
Núcleos 44 (HT desativado)
CPU Intel Xeon Platina 8168
Freqüência da CPU (não-AVX) 3,7 GHz (núcleo único), 2,7-3,4 GHz (todos os núcleos)
Memória 8 GB/núcleo (352 no total)
Disco Local SSD de 700 GB
Infiniband 100 Gb EDR Mellanox ConnectX-5
Rede Ethernet de 50 Gb (40 Gb utilizável) SmartNIC de segunda geração do Azure

Especificações de software

Especificações de software VM série HC
Tamanho máximo do trabalho MPI 13200 núcleos (300 VMs em um único conjunto de escala de máquina virtual com singlePlacementGroup=true)
Suporte MPI HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, Plataforma MPI
Estruturas adicionais UCX, libfabric, PGAS
Suporte de armazenamento do Azure Discos Standard e Premium (máximo 4 discos)
Suporte de SO para SRIOV RDMA CentOS/RHEL 7.6+, Ubuntu 18.04+, SLES 15.4, WinServer 2016+
Suporte ao Orchestrator CycleCloud, Batch, AKS; Opções de configuração de cluster

Importante

Este documento faz referência a uma versão de lançamento do Linux que está se aproximando ou em Fim da Vida Útil (EOL). Por favor, considere atualizar para uma versão mais atual.

Próximos passos

  • Saiba mais sobre a arquitetura Intel Xeon SP.
  • Leia sobre os anúncios mais recentes, exemplos de carga de trabalho HPC e resultados de desempenho nos Blogs da Comunidade de Tecnologia de Computação do Azure.
  • Para obter uma exibição de arquitetura de nível superior da execução de cargas de trabalho HPC, consulte Computação de alto desempenho (HPC) no Azure.