Usar GPUs com VMs clusterizadas
Aplica-se a: Windows Server 2025 (versão preliminar)
Importante
GPU com VMs clusterizadas no Windows Server 2025 está em pré-visualização. Estas informações estão relacionadas a um produto de pré-lançamento, que pode ser bastante modificado antes de ser lançado. A Microsoft não faz nenhuma garantia, expressa ou implícita, com relação às informações fornecidas aqui.
Aplica-se a: Azure Stack HCI, versões 23H2 e 22H2
Observação
A maneira recomendada de criar e gerenciar VMs no Azure Stack HCI 23H2 é usando o plano de controle do Azure Arc. Use o mecanismo descrito abaixo para gerenciar suas VMs somente se você precisar de funcionalidade que não esteja disponível nas VMs do Azure Arc.
Você pode incluir GPUs em seus clusters para fornecer aceleração de GPU para cargas de trabalho em execução em VMs clusterizadas. A aceleração da GPU é fornecida por meio da Atribuição de Dispositivo Discreto (DDA), que permite dedicar uma ou mais GPUs físicas a uma VM. As VMs clusterizadas podem aproveitar a aceleração da GPU e os recursos de clustering, como alta disponibilidade via failover. A migração ao vivo de máquinas virtuais (VMs) não é suportada no momento, mas as VMs podem ser reiniciadas automaticamente e colocadas onde os recursos da GPU estão disponíveis se houver uma falha.
Neste artigo, saiba como usar unidades de processamento gráfico (GPUs) com VMs clusterizadas para fornecer aceleração de GPU para cargas de trabalho nas VMs clusterizadas. Este artigo orienta você durante a preparação do cluster, atribuição de uma GPU a uma VM de cluster e failover dessa VM usando o Windows Admin Center e o PowerShell.
Pré-requisitos
Há vários requisitos e coisas a serem consideradas antes de começar a usar GPUs com VMs clusterizadas:
- Você precisa de um cluster HCI do Azure Stack executando o Azure Stack HCI, versão 21H2 ou posterior.
- Você precisa de um cluster de Failover do Windows Server executando o Windows Server 2025 ou posterior.
Você também precisa de GPUs instaladas em todos os servidores do cluster.
Revise e siga as instruções do fabricante da GPU para instalar os drivers e o software necessários em cada servidor no cluster.
Dependendo do fornecedor do hardware, talvez você também precise configurar quaisquer requisitos de licenciamento de GPU.
Você precisa de um computador com o Windows Admin Center instalado. Esta máquina pode ser um dos nós do cluster.
Crie uma VM à qual atribuir a GPU. Prepare essa VM para DDA definindo seu comportamento de cache, ação de parada e propriedades de E/S mapeada de memória (MMIO) de acordo com as instruções em Implantar dispositivos gráficos usando atribuição de dispositivo discreto.
Prepare as GPUs em cada servidor instalando drivers de mitigação de segurança em cada servidor, desabilitando as GPUs e desmontando-as do host. Para saber mais sobre esse processo, consulte Implantar dispositivos gráficos usando a atribuição de dispositivo discreto.
Crie uma VM à qual atribuir a GPU. Prepare essa VM para DDA definindo seu comportamento de cache, ação de parada e propriedades de E/S mapeada de memória (MMIO) de acordo com as instruções em Implantar dispositivos gráficos usando atribuição de dispositivo discreto.
Prepare as GPUs em cada servidor instalando drivers de mitigação de segurança em cada servidor, desabilitando as GPUs e desmontando-as do host. Para saber mais sobre esse processo, consulte Implantar dispositivos gráficos usando a atribuição de dispositivo discreto.
Observação
O Catálogo HCI do Azure Stack ainda não indica informações de certificação ou compatibilidade de GPU.
Preparar o cluster
Quando os pré-requisitos estiverem concluídos , você poderá preparar o cluster para usar GPUs com VMs clusterizadas.
A preparação do cluster envolve a criação de um pool de recursos que contém as GPUs disponíveis para atribuição às VMs. O cluster usa esse pool para determinar o posicionamento da VM para qualquer VM iniciada ou movida atribuída ao pool de recursos da GPU.
Usando o Windows Admin Center, siga estas etapas para preparar o cluster para usar GPUs com VMs clusterizadas.
Para preparar o cluster e atribuir uma VM a um pool de recursos da GPU:
Inicie o Windows Admin Center e verifique se a extensão GPUs já está instalada.
Selecione Gerenciador de Cluster no menu suspenso superior e conecte-se ao cluster.
No menu Configurações, selecione Extensões>GPUs.
No menu Ferramentas, em Extensões, selecione GPUs para abrir a ferramenta.
Na página principal da ferramenta, selecione a guia Pools de GPU e selecione Criar pool de GPUs.
Na página Novo pool de GPUs, especifique o seguinte e selecione Salvar:
- Nome do servidor
- Nome do pool de GPUs
- GPUs que você deseja adicionar ao pool
Após a conclusão do processo, você receberá um prompt de êxito que mostra o nome do novo pool de GPUs e do servidor host.
Atribuir uma VM a um pool de recursos da GPU
Agora você pode atribuir uma VM a um pool de recursos da GPU. Você pode atribuir uma ou mais VMs a um pool de recursos de GPU clusterizado e remover uma VM de um pool de recursos de GPU clusterizada.
Siga estas etapas para atribuir uma VM existente a um pool de recursos de GPU usando o Windows Admin Center.
Observação
Você também precisa instalar drivers do fabricante da GPU dentro da VM para que os aplicativos na VM possam aproveitar a GPU atribuída a eles.
Na página Atribuir VM ao pool de GPUs, especifique o seguinte e selecione Atribuir:
- Nome do servidor
- Nome do pool de GPUs
- Máquina virtual à qual você deseja atribuir a GPU a partir do pool de GPUs.
Você também pode definir valores de configuração avançados para espaços de E/S mapeados para memória (MMIO) para determinar os requisitos de recursos para uma única GPU.
Depois que o processo for concluído, você receberá um prompt de confirmação que mostra que você atribuiu com êxito a GPU do pool de recursos da GPU à VM, que é exibida em VMs atribuídas.
Para cancelar a atribuição de uma VM de um pool de recursos da GPU:
Na guia Pools de GPU, selecione a GPU que você deseja cancelar a atribuição e selecione Cancelar atribuição de VM.
Na página Cancelar atribuição de VM do pool de GPUs, na caixa de listagem Máquinas virtuais, especifique o nome da VM e selecione Desatribuir.
Depois que o processo for concluído, você receberá um prompt de êxito informando que a VM foi desatribuída do pool de GPUs e, em Status de atribuição, a GPU mostrará Disponível (Não atribuída).
Quando você inicia a VM, o cluster garante que a VM seja colocada em um servidor com recursos de GPU disponíveis desse pool de cluster. O cluster também atribui a GPU à VM por meio de DDA, o que permite que a GPU seja acessada a partir de cargas de trabalho dentro da VM.
Failover de uma VM com uma GPU atribuída
Para testar a capacidade do cluster de manter sua carga de trabalho de GPU disponível, execute uma operação de drenagem no servidor em que a VM está sendo executada com uma GPU atribuída. Para drenar o servidor, siga as instruções em Procedimentos de manutenção de cluster de failover. O cluster reinicia a VM em outro servidor no cluster, desde que outro servidor tenha recursos de GPU disponíveis suficientes no pool que você criou.
Para testar a capacidade do cluster de manter sua carga de trabalho de GPU disponível, execute uma operação de drenagem no servidor em que a VM está sendo executada com uma GPU atribuída. Para drenar o servidor, siga as instruções em Procedimentos de manutenção de cluster de failover. O cluster reinicia a VM em outro servidor no cluster, desde que outro servidor tenha recursos de GPU disponíveis suficientes no pool que você criou.
Conteúdo relacionado
Para obter mais informações sobre como usar GPUs com suas VMs clusterizadas, consulte:
Para obter mais informações sobre como usar GPUs com suas VMs e particionamento de GPU, consulte:
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de