Ativar o Infiniband
Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes
As VMs HB-series e N-series compatíveis com RDMA comunicam através da rede InfiniBand de baixa latência e alta largura de banda. A capacidade RDMA em tal interconexão é fundamental para aumentar a escalabilidade e o desempenho de cargas de trabalho de HPC e IA de nó distribuído. As VMs das séries HB e N habilitadas para InfiniBand são conectadas em uma árvore de gordura sem bloqueios com um design de baixo diâmetro para um desempenho RDMA otimizado e consistente.
Há várias maneiras de habilitar o InfiniBand nos tamanhos de VM capazes.
Imagens VM com drivers InfiniBand
Consulte Imagens de VM para obter uma lista de imagens de VM suportadas no Marketplace, que vêm pré-carregadas com drivers InfiniBand (para VMs SR-IOV ou não-SR-IOV) ou podem ser configuradas com os drivers apropriados para VMs compatíveis com RDMA. As imagens de VM Ubuntu-HPC e AlmaLinux-HPC no mercado são a maneira mais fácil de começar.
Extensões de VM do driver InfiniBand
No Linux, a extensão InfiniBandDriverLinux VM pode ser usada para instalar os drivers Mellanox OFED e habilitar o InfiniBand nas VMs HB-series e N-series habilitadas para SR-IOV.
No Windows, a extensão InfiniBandDriverWindows VM instala drivers Windows Network Direct (em VMs não-SR-IOV) ou drivers Mellanox OFED (em VMs SR-IOV) para conectividade RDMA. Em determinadas implantações de instâncias A8 e A9, a extensão HpcVmDrivers é adicionada automaticamente. Observe que a extensão de VM HpcVmDrivers está sendo preterida; não será atualizado.
Para adicionar a extensão de VM a uma VM, você pode usar cmdlets do Azure PowerShell . Para obter mais informações, consulte Extensões e recursos de máquina virtual. Você também pode trabalhar com extensões para VMs implantadas no modelo de implantação clássico.
Instalação manual
Os drivers Mellanox OpenFabrics (OFED) podem ser instalados manualmente nas VMs HB-series e N-series habilitadas para SR-IOV.
Linux
Os drivers OFED para Linux podem ser instalados com o exemplo abaixo. Embora o exemplo aqui seja para RHEL, mas as etapas são gerais e podem ser usadas para qualquer sistema operacional Linux compatível, como Ubuntu (18.04, 19.04, 20.04) e SLES (12 SP4+ e 15). Mais exemplos para outras distros estão no repositório azhpc-images. Os drivers da caixa de entrada também funcionam, mas os drivers Mellanox OFED fornecem mais recursos.
MLNX_OFED_DOWNLOAD_URL=http://content.mellanox.com/ofed/MLNX_OFED-5.0-2.1.8.0/MLNX_OFED_LINUX-5.0-2.1.8.0-rhel7.7-x86_64.tgz
# Optionally verify checksum
wget --retry-connrefused --tries=3 --waitretry=5 $MLNX_OFED_DOWNLOAD_URL
tar zxvf MLNX_OFED_LINUX-5.0-2.1.8.0-rhel7.7-x86_64.tgz
KERNEL=( $(rpm -q kernel | sed 's/kernel\-//g') )
KERNEL=${KERNEL[-1]}
# Uncomment the lines below if you are running this on a VM
#RELEASE=( $(cat /etc/redhat-release | awk '{print $4}') )
#yum -y install http://olcentgbl.trafficmanager.net/redhat/${RELEASE}/updates/x86_64/kernel-devel-${KERNEL}.rpm
sudo yum install -y kernel-devel-${KERNEL}
sudo ./MLNX_OFED_LINUX-5.0-2.1.8.0-rhel7.7-x86_64/mlnxofedinstall --kernel $KERNEL --kernel-sources /usr/src/kernels/${KERNEL} --add-kernel-support --skip-repo
Windows
Para Windows, baixe e instale os drivers Mellanox OFED para Windows.
Ativar IP sobre InfiniBand (IB)
Se você planeja executar trabalhos MPI, normalmente não precisa de IPoIB. A biblioteca MPI usará a interface de verbos para comunicação IB (a menos que você use explicitamente o canal TCP/IP da biblioteca MPI). Mas se você tem um aplicativo que usa TCP/IP para comunicação e deseja executar sobre IB, você pode usar IPoIB sobre a interface IB. Use os seguintes comandos (para RHEL) para habilitar o IP sobre InfiniBand.
Importante
Para evitar problemas, certifique-se de que não está a executar versões mais antigas do Microsoft Azure Linux Agent (waagent). Recomendamos usar pelo menos a versão 2.4.0.2 antes de ativar o IP sobre IB.
sudo sed -i -e 's/# OS.EnableRDMA=n/OS.EnableRDMA=y/g' /etc/waagent.conf
sudo systemctl restart waagent
Próximos passos
- Saiba mais sobre como instalar e executar várias bibliotecas MPI suportadas nas VMs.
- Analise a visão geral da série HBv3 e a visão geral da série HC.
- Leia sobre os anúncios mais recentes, exemplos de carga de trabalho HPC e resultados de desempenho nos Blogs da Comunidade de Tecnologia de Computação do Azure.
- Para obter uma exibição de arquitetura de nível superior da execução de cargas de trabalho HPC, consulte Computação de alto desempenho (HPC) no Azure.