Share via


Extensão de driver InfiniBand para Linux

Cuidado

Este artigo faz referência ao CentOS, uma distribuição do Linux que está se aproximando do status de EOL (fim da vida útil). Considere seu uso e planeje adequadamente. Para obter mais informações, veja as Diretrizes sobre fim da vida útil do CentOS.

Essa extensão instala os drivers InfiniBand OFED nas VMs das séries HB e séries N habilitadas para InfiniBand e SR-IOV que executam o Linux. Dependendo da família de VMs, a extensão instala os drivers apropriados para a NIC Connect-X. Ela não instala os drivers InfiniBand ND em VMs da série HB e da série N não habilitadas para SR-IOV.

As instruções sobre a instalação manual dos drivers OFED estão disponíveis em Habilitar InfiniBand em VMs com HPC.

Uma extensão também está disponível para instalar os drivers InfiniBand para VMs Windows.

Pré-requisitos

Sistema operacional

Esta extensão é compartível com as seguintes distribuições do sistema operacional, dependendo do suporte do driver para uma versão específica do sistema operacional. Para ver a lista mais recente das versões compatíveis do sistema operacional e do driver, confira resources.json

Distribuição Versão Drivers de NIC InfiniBand
Ubuntu 18.04 LTS, 20.04 LTS CX3-Pro, CX5, CX6
CentOS 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.1, 8,2 CX3-Pro, CX5, CX6
Red Hat Enterprise Linux 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.1, 8,2 CX3-Pro, CX5, CX6

Importante

Este documento faz referência a uma versão de lançamento do Linux que está se aproximando do Fim da Vida Útil (EOL). Considere atualizar para uma versão mais recente.

Conectividade com a Internet

A extensão do Microsoft Azure para drivers InfiniBand requer que a VM de destino esteja conectada e tenha acesso à Internet.

Esquema de extensão

O JSON a seguir mostra o esquema para a extensão.

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "InfiniBandDriverLinux",
    "typeHandlerVersion": "1.2",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Propriedades

Nome Valor/Exemplo Tipo de Dados
apiVersion 2015-06-15 date
publicador Microsoft.HpcCompute string
type InfiniBandDriverLinux string
typeHandlerVersion 1.2 INT

Implantação

Modelo do Azure Resource Manager

Extensões de VM do Azure podem ser implantadas com modelos do Azure Resource Manager. Modelos são ideais ao implantar uma ou mais máquinas virtuais que exigem configuração pós-implantação.

A configuração do JSON para uma extensão da máquina virtual pode ser aninhado dentro do recurso de máquina virtual ou localizado no nível de raiz ou superior de um modelo JSON do Resource Manager. O posicionamento da configuração do JSON afeta o valor do tipo e nome do recurso. Para obter mais informações, consulte Definir o nome e o tipo de recursos filho.

O exemplo a seguir pressupõe que a extensão está aninhada dentro do recurso de máquina virtual. Ao aninhar o recurso de extensão, o JSON é colocado no objeto "resources": [] da máquina virtual.

{
  "name": "myExtensionName",
  "type": "extensions",
  "location": "[resourceGroup().location]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', myVM)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "InfiniBandDriverLinux",
    "typeHandlerVersion": "1.2",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Set-AzVMExtension
    -ResourceGroupName "myResourceGroup" `
    -VMName "myVM" `
    -Location "southcentralus" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "InfiniBandDriverLinux" `
    -ExtensionType "InfiniBandDriverLinux" `
    -TypeHandlerVersion 1.2 `
    -SettingString '{ `
	}'

CLI do Azure

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name InfiniBandDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.2

Adicionar extensão a um conjunto de dimensionamento de máquinas virtuais

O seguinte exemplo instala a extensão InfiniBandDriverLinux mais recente da versão 1.2 em todas as VMs compatíveis com RDMA em um conjunto de dimensionamento de máquinas virtuais existente chamado myVMSS implantado no grupo de recursos chamado myResourceGroup:

$VMSS = Get-AzVmss -ResourceGroupName "myResourceGroup" -VMScaleSetName "myVMSS"
Add-AzVmssExtension -VirtualMachineScaleSet $VMSS -Name "InfiniBandDriverLinux" -Publisher "Microsoft.HpcCompute" -Type "InfiniBandDriverLinux" -TypeHandlerVersion "1.2"
Update-AzVmss -ResourceGroupName "myResourceGroup" -VMScaleSetName "MyVMSS" -VirtualMachineScaleSet $VMSS
Update-AzVmssInstance -ResourceGroupName "myResourceGroup" -VMScaleSetName "myVMSS" -InstanceId "*"

Solução de problemas e suporte

Solucionar problemas

Os dados sobre o estado das implantações de extensão podem ser recuperados no Portal do Azure usando o Azure PowerShell e a CLI do Azure. Para ver o estado da implantação das extensões de uma determinada VM, execute o comando a seguir.

Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table

A saída de execução da extensão é registrada no arquivo a seguir. Confira este arquivo para acompanhar o status de instalação, bem como para solucionar problemas de quaisquer falhas.

/var/log/azure/ib-vmext-status

Códigos de saída

A tabela a seguir descreve o significado e a ação recomendada com base nos códigos de saída do processo de instalação da extensão.

Código de Saída Significado Ação possível
0 Operação concluída com êxito
1 Uso incorreto de extensão Verifique o log de saída de execução
10 Serviços de integração do Linux para Hyper-V e o Azure não disponível ou instalado Verificação de saída de Ispci
11 Mellanox InfiniBand não encontrado neste tamanho de VM Use um tamanho da VM e sistema operacional com suporte
12 Oferta de imagem não suportada
13 Tamanho de VM não suportado Usar uma VM da Série H e Série N habilitada para InfiniBand (tamanho 'r') para implantar
14 Operação falhou Verifique o log de saída de execução

Suporte

Caso precise de mais ajuda em qualquer ponto deste artigo, entre em contato com os especialistas do Azure nos fóruns do Azure e do Stack Overflow no MSDN. Como alternativa, você pode arquivar um incidente de suporte por meio do site de Suporte do Azure. Para saber mais sobre como usar o suporte do Azure, leia as Perguntas frequentes sobre o suporte do Microsoft Azure.

Próximas etapas

Para obter mais informações sobre as VMs habilitadas para InfiniBand (tamanho 'r'), confira VMs da Série HB e da Série N.