Particionamento de GPU

Aplica-se a: ✅ Windows Server 2025

O particionamento de GPU permite que você compartilhe um dispositivo de GPU físico com várias máquinas virtuais (VMs). Com o particionamento de GPU ou a virtualização de GPU, cada VM obtém uma fração dedicada da GPU em vez de toda a GPU.

O recurso de particionamento de GPU usa a interface SR-IOV (Virtualização de E/S de Raiz Única), que oferece um limite de segurança com suporte de hardware com desempenho previsível para cada VM. Cada VM pode acessar apenas os recursos de GPU dedicados a elas e o particionamento de hardware seguro impede o acesso não autorizado por outras VMs.

A partir do Windows Server 2025, há suporte para a migração ao vivo com particionamento de GPU, permitindo maior flexibilidade para gerenciar máquinas virtuais. Para utilizar a migração dinâmica com particionamento de GPU, verifique se sua configuração atende aos requisitos descritos neste artigo. A migração dinâmica permite mover VMs entre hosts sem tempo de inatividade, o que é essencial para manutenção e balanceamento de carga em um ambiente de produção.

Esse recurso permite migrações de VM planejadas, mantendo a alocação de recursos de GPU, garantindo tempo de inatividade mínimo e desempenho consistente.

O particionamento de GPU foi projetado para servidores autônomos. Você pode migrar VMs em tempo real entre nós autônomos para tempo de inatividade planejado; no entanto, para clientes que exigem clustering para tempo de inatividade não planejado, você deve usar Windows Server 2025 Datacenter.

Quando usar o particionamento de GPU

Algumas cargas de trabalho, como VDI (infraestrutura de área de trabalho virtual), IA (inteligência artificial) e inferência de ML (Machine Learning) exigem aceleração de GPU, o particionamento de GPU pode ajudar a reduzir o custo total de propriedade de sua infraestrutura geral.

Por exemplo:

Aplicativos VDI: os clientes de borda distribuídos executam aplicativos básicos de produtividade, como o Microsoft Office e cargas de trabalho de visualização com muitos gráficos em seus ambientes VDI, que exigem aceleração de GPU. Para essas cargas de trabalho, você pode obter a aceleração de GPU necessária por meio de DDA ou particionamento de GPU. Com o particionamento de GPU, você pode criar várias partições e atribuir cada partição à VM que hospeda um ambiente VDI. O particionamento de GPU ajuda você a atingir a densidade desejada e dimensionar o número de usuários suportados por uma ordem de magnitude.
Inferência com ML: os clientes em lojas de varejo e fábricas podem executar inferência na borda, o que requer suporte de GPU para seus servidores. Usando a GPU em seus servidores, você pode executar modelos de ML para obter resultados rápidos que podem ser acionados antes que os dados sejam enviados para a nuvem. O conjunto de dados completo pode ser transferido para continuar a treinar novamente e melhorar os modelos de ML. Junto com o DDA, em que você dedica uma GPU física inteira a uma VM, o particionamento de GPU permite que você execute vários aplicativos de inferência simultaneamente na mesma GPU, mas em partições de hardware separadas, maximizando a utilização da GPU.

Requirements

Para usar o particionamento de GPU com migração dinâmica, você precisa ter uma CPU, sistema operacional e GPU com suporte. As seções a seguir descrevem os requisitos.

Requisitos de CPU

Os hosts de cluster precisam ter processadores compatíveis com controle de bits de DMA de IOMMU (Unidade de Gerenciamento de Memória de Entrada/Saída). Por exemplo, processadores que suportam Intel VT-D ou AMD-Vi. Se você usar o Windows Server e a migração ao vivo sem processadores habilitados para IOMMU, as VMs serão automaticamente reiniciadas onde os recursos da GPU estiverem disponíveis.

Exemplos de processadores que dão suporte ao acompanhamento de bits de IOMMU DMA incluem:

AMD EPYC 7002 e posterior (Milão)
Intel Xeon SP de 4ª Geração (Sapphire Rapids)

Sistemas operacionais convidados com suporte

O particionamento de GPU no Windows Server 2025 e posterior oferece suporte a estes sistemas operacionais convidados:

Windows 10 ou versões mais recentes
Windows 10 Enterprise de várias sessões ou posterior
Windows Server 2019 ou posterior
Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS

GPUs com suporte

As seguintes GPUs suportam particionamento de GPU:

NVIDIA A2
NVIDIA A10
NVIDIA A16
NVIDIA A40
NVIDIA L2
NVIDIA L4
NVIDIA L40
NVIDIA L40S

Para usar a migração dinâmica com particionamento de GPU, você deve usar o driver incluído no NVIDIA vGPU Software v18.x ou posterior. O driver NVIDIA fornece o suporte necessário para recursos de particionamento de GPU e migração dinâmica.

Recomendamos trabalhar com seus parceiros OEM (Fabricante de Equipamentos Originais) para planejar e ordenar sistemas adaptados às suas cargas de trabalho. Além disso, consulte os IHVs (Fornecedores Independentes de Hardware) da GPU para garantir que você tenha as configurações apropriadas e o software necessário para sua instalação. No entanto, oferecemos suporte a GPUs adicionais se você quiser usar a aceleração de GPU via DDA (atribuição de dispositivo discreto). Entre em contato com seus parceiros OEM e IHVs para obter uma lista de GPUs compatíveis com DDA. Para obter mais informações sobre como usar a aceleração de GPU via DDA, consulte DDA (atribuição de dispositivo discreto).

Para obter o melhor desempenho, recomendamos que você crie uma configuração homogênea para GPUs em todos os servidores do cluster. Uma configuração homogênea consiste em instalar a mesma marca e modelo da GPU e configurar a mesma contagem de partições nas GPUs em todos os servidores no cluster. Por exemplo, em um cluster de dois servidores com uma ou mais GPUs instaladas, todas as GPUs devem ter a mesma marca, modelo e tamanho. A contagem de partições em cada GPU também deve corresponder.

Limitations

Considere as seguintes limitações ao usar o recurso de particionamento de GPU:

O particionamento de GPU não será suportado se sua configuração não for homogênea. Veja a seguir alguns exemplos de configurações não suportadas:
- Mistura de GPUs de diferentes fornecedores no mesmo cluster.
- Usando modelos de GPU diferentes de famílias de produtos diferentes do mesmo fornecedor no mesmo cluster.
Não é possível atribuir uma GPU física como DDA (atribuição de dispositivo discreto) ou GPU particionável. Você pode atribuí-la como DDA ou como GPU particionável, mas não ambos.
Se você atribuir mais de uma partição de GPU a uma VM, cada partição será exibida como outra GPU.
As partições são atribuídas automaticamente às VMs. Não é possível escolher uma partição específica para uma VM específica.
Você pode particionar sua GPU usando o Windows Admin Center ou usando o PowerShell. Recomendamos que você use o Windows Admin Center para configurar e atribuir partições de GPU. O Windows Admin Center valida automaticamente para uma configuração homogênea das GPUs em todos os servidores do cluster. Ele fornece avisos e erros apropriados para tomar qualquer ação corretiva necessária.
Se estiver usando o PowerShell para habilitar o particionamento de GPU, você deverá executar as mesmas etapas de configuração em cada servidor no cluster. Você deve garantir manualmente que a configuração homogênea seja mantida para GPUs em todos os servidores do cluster.
Ao migrar ao vivo uma máquina virtual com uma partição de GPU atribuída, a migração ao vivo do Hyper-V voltará automaticamente ao uso de TCP/IP com compactação. Migrar uma máquina virtual tem o efeito potencial de aumentar a utilização da CPU de um host. Além disso, as migrações ao vivo podem levar mais tempo do que com máquinas virtuais sem partições de GPU conectadas.

Para obter mais informações sobre como usar GPUs com suas VMs e particionamento de GPU, consulte:

Comentários

Esta página foi útil?

Last updated on 2025-08-16