Instale controladores GPU da NVIDIA em VMs da série N que executam o Windows

Aplica-se a: ✔️ Conjuntos de escala flexível Linux VMs ✔️ Windows VMs ✔️

Para tirar partido das capacidades de GPU de VMs da série Azure N apoiados por GPUs NVIDIA, você deve instalar controladores GPU NVIDIA. A extensão do condutor do GPU NVIDIA instala controladores NVIDIA CUDA ou GRID apropriados num VM da série N. Instale ou gerencie a extensão utilizando os modelos de portal do Azure ou ferramentas como Azure PowerShell ou Azure Resource Manager. Consulte a documentação da extensão do condutor do GPU da NVIDIA para sistemas operativos suportados e etapas de implantação.

Se optar por instalar manualmente os controladores da NVIDIA GPU, este artigo fornece sistemas operativos suportados, controladores e etapas de instalação e verificação. Informações de configuração manual do controlador também estão disponíveis para Os VMs Linux.

Para especificações básicas, capacidades de armazenamento e detalhes do disco, consulte os tamanhos VM do GPU Windows.

Sistemas operativos e controladores suportados

Condutores da NVIDIA Tesla (CUDA)

Os controladores NVIDIA Tesla (CUDA) para NC, NCv2, NCv3, NCasT4_v3, ND e NDv2 série VMs (opcional para série NV) são testados nos sistemas operativos listados na tabela seguinte. O condutor da CUDA é genérico e não específico do Azure. Para os controladores mais recentes, visite o Web site da NVIDIA.

Dica

Como alternativa à instalação manual do controlador CUDA num VM do Windows Server, pode implementar uma imagem Máquina Virtual de Ciência de Dados Azure. As edições DSVM para Windows Server 2016 pré-instalar os controladores NVIDIA CUDA, a Biblioteca da Rede Neural Profunda CUDA, e outras ferramentas.

SO Controlador
Windows Server 2019 451,82 (.exe)
Windows Server 2016 451,82 (.exe)

Condutores da NVIDIA GRID

A Microsoft redistribui os instaladores de controladores NVIDIA GRID para VM da série NV e NVv3 utilizados como estações de trabalho virtuais ou para aplicações virtuais. Instale apenas estes controladores GRID em VMs da série Azure NV, apenas nos sistemas operativos listados na tabela seguinte. Estes controladores incluem licenciamento para GRID Virtual GPU Software em Azure. Não precisa de configurar um servidor de licença de software NVIDIA vGPU.

Os controladores GRID redistribuídos pela Azure não funcionam em VMs não-NV séries como NCv2, NCv3, ND e NDv2 série VMs. A única exceção é a série VM NCas_T4_V3 onde os controladores GRID permitirão as funcionalidades gráficas semelhantes às séries NV.

Os NC-Series com GPUs Nvidia K80 não suportam aplicações GRID/graphics.

A extensão Nvidia instala sempre o mais recente controlador. As seguintes ligações às versões anteriores são fornecidas para suportar dependências em versões de controlador mais antigas.

Para o Windows Server 2022, Windows Server 2019, Windows Server 2016 1607, 1709, Windows 10 e Windows 11:

Para Windows Server 2012 R2:

Nota

As versões Azure NVads A10 v5 VMs suportam apenas versões GRID 14.1 (512.78) ou mais altas do condutor.

Para obter links para todas as versões anteriores do controlador Nvidia GRID, visite o GitHub.

Instalação do condutor

  1. Conecte-se por Remote Desktop a cada VM da série N.

  2. Faça o download, extrai e instale o controlador suportado para o seu sistema operativo Windows.

Após a instalação do controlador GRID num VM, é necessário reiniciar. Após a instalação do controlador CUDA, não é necessário reiniciar.

Verifique a instalação do condutor

Tenha em atenção que o painel de controlo da Nvidia só está acessível com a instalação do controlador GRID. Se tiver instalado controladores CUDA, o painel de controlo da Nvidia não será visível.

Pode verificar a instalação do controlador em Gestor de Dispositivos. O exemplo a seguir mostra uma configuração bem sucedida do cartão Tesla K80 num VM Azure NC.

Propriedades do condutor da GPU

Para consultar o estado do dispositivo GPU, corram o utilitário da linha de comando nvidia-smi instalado com o controlador.

  1. Abra uma pronta de comando e mude para o diretório C:\Program Files\NVIDIA Corporation\NVSMI .

  2. Execute nvidia-smi. Se o controlador estiver instalado, verá uma saída semelhante à seguinte. O GPU-Util mostra 0% a menos que esteja atualmente a executar uma carga de trabalho gpu no VM. A versão do seu condutor e os detalhes da GPU podem ser diferentes dos apresentados.

Estado do dispositivo NVIDIA

Conectividade da rede RDMA

A conectividade da rede RDMA pode ser ativada em VMs da série N com capacidade RDMA, tais como NC24r implantados no mesmo conjunto de disponibilidade ou num único grupo de colocação num conjunto de escala de máquina virtual. A extensão HpcVmDrivers deve ser adicionada para instalar controladores de dispositivos de rede Windows que permitem a conectividade RDMA. Para adicionar a extensão VM a um VM da série N ativado por RDMA, utilize Azure PowerShell cmdlets para Resource Manager Azure.

Para instalar a mais recente extensão 1.1 HpcVMDrivers numa VM com capacidade rdma existente chamada myVM na região dos EUA Ocidentais:

Set-AzVMExtension -ResourceGroupName "myResourceGroup" -Location "westus" -VMName "myVM" -ExtensionName "HpcVmDrivers" -Publisher "Microsoft.HpcCompute" -Type "HpcVmDrivers" -TypeHandlerVersion "1.1"

Para mais informações, consulte extensões e funcionalidades da máquina Virtual para Windows.

A rede RDMA suporta o tráfego de Interface de Passagem de Mensagens (MPI) para aplicações em execução com Microsoft MPI ou Intel MPI 5.x.

Passos seguintes