Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
O particionamento de GPU permite que você compartilhe um dispositivo de GPU físico com várias máquinas virtuais (VMs). Com o particionamento de GPU ou virtualização de GPU, cada VM obtém uma fração dedicada da GPU em vez de toda a GPU.
O recurso de particionamento de GPU usa a interface Single Root IO Virtualization (SR-IOV), que fornece um limite de segurança apoiado por hardware com desempenho previsível para cada VM. Cada VM pode acessar apenas os recursos da GPU dedicados a elas e o particionamento de hardware seguro impede o acesso não autorizado por outras VMs.
A partir do Windows Server 2025, a migração em tempo real é suportada com partição GPU, permitindo maior flexibilidade na gestão de máquinas virtuais. Para utilizar a migração ao vivo com particionamento de GPU, verifique se sua configuração atende aos requisitos descritos neste artigo. A migração ao vivo permite mover VMs entre hosts sem tempo de inatividade, o que é essencial para manutenção e balanceamento de carga em um ambiente de produção.
Esse recurso permite migrações de VM planejadas enquanto mantém a alocação de recursos da GPU, garantindo tempo de inatividade mínimo e desempenho consistente.
O particionamento GPU foi projetado para servidores autônomos. Pode migrar VMs em tempo real entre nós independentes para períodos de inatividade planeados; no entanto, para clientes que necessitam de clustering devido a períodos de inatividade não planeados, deve usar o Windows Server 2025 Datacenter.
Quando usar o particionamento de GPU
Algumas cargas de trabalho, como a infraestrutura de ambiente de trabalho virtual (VDI), a inferência de Inteligência Artificial (IA) e Machine Learning (ML), requerem aceleração da GPU; a partição da GPU pode ajudar a reduzir o custo total de posse da infraestrutura global.
Por exemplo:
Aplicações VDI: Os clientes de edge distribuídos executam aplicações básicas de produtividade, como o Microsoft Office e cargas de trabalho de visualização gráficas pesadas nos seus ambientes VDI, que requerem aceleração da GPU. Para essas cargas de trabalho, você pode obter a aceleração de GPU necessária via DDA ou particionamento de GPU. Com o particionamento de GPU, você pode criar várias partições e atribuir cada partição à VM que hospeda um ambiente VDI. O particionamento de GPU ajuda você a alcançar a densidade desejada e dimensionar o número de usuários suportados por uma ordem de magnitude.
Inferência com ML: os clientes em lojas de retalho e fábricas podem executar a inferência na extremidade, o que requer suporte de GPU para os seus servidores. Usando GPU em seus servidores, você pode executar modelos de ML para obter resultados rápidos que podem ser acionados antes que os dados sejam enviados para a nuvem. O conjunto de dados completo pode, opcionalmente, ser transferido para continuar a treinar novamente e melhorar seus modelos de ML. Junto com o DDA, onde você dedica uma GPU física inteira a uma VM, o particionamento de GPU permite executar vários aplicativos de inferência simultaneamente na mesma GPU, mas em partições de hardware separadas, maximizando a utilização da GPU.
Requirements
Para usar o particionamento de GPU com migração ao vivo, você precisa ter uma CPU, sistema operacional e GPU suportados. As seções a seguir descrevem os requisitos.
Requisitos da CPU
Os hosts de cluster precisam ter processadores compatíveis com rastreamento de bits DMA da Unidade de Gerenciamento de Memória de Entrada/Saída (IOMMU). Por exemplo, processadores que suportam Intel VT-D ou AMD-Vi. Se usar Windows Server e migração ao vivo sem processadores com IOMMU, as VMs são automaticamente reiniciadas onde os recursos da GPU estão disponíveis.
Exemplos de processadores que suportam o rastreamento de bits DMA do IOMMU para migração ao vivo com particionamento da GPU incluem:
- AMD EPYC 7003 e posteriores (Milão)
- Intel Xeon SP de 4ª geração (Sapphire Rapids)
Os processadores AMD EPYC 7002 (Rome) suportam particionamento da GPU, mas não suportam migração em tempo real com partição da GPU.
Sistemas operativos convidados suportados
A partição da GPU no Windows Server 2025 e posteriores suporta estes sistemas operativos convidados:
- Windows 10 ou versões posteriores
- Windows 10 Enterprise multisessão ou posterior
- Windows Server 2019 ou versões posteriores
- Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS
GPUs suportadas
As seguintes GPUs suportam particionamento de GPU:
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
- NVIDIA RTX Pro 6000 Blackwell Server Edition
- AMD V710
Para usar migração ao vivo com partição de GPU para GPUs NVIDIA, deve usar o driver incluído no software NVIDIA vGPU v18.x ou posterior. O driver NVIDIA fornece o suporte necessário para particionamento de GPU e recursos de migração ao vivo.
Recomendamos que trabalhe com os seus parceiros OEM (Original Equipment Manufacturer) para planear e encomendar sistemas adaptados às suas cargas de trabalho. Além disso, consulte IHVs (GPU Independent Hardware Vendors) para garantir que você tenha as configurações apropriadas e o software necessário para sua configuração. No entanto, suportamos mais GPUs se você quiser usar a aceleração de GPU via Discrete Device Assignment (DDA). Entre em contato com seus parceiros OEM e IHVs para obter uma lista de GPUs que suportam DDA. Para obter mais informações sobre como usar a aceleração de GPU via DDA, consulte Discrete Device Assignment (DDA).
Para obter o melhor desempenho, recomendamos que você crie uma configuração homogênea para GPUs em todos os servidores do cluster. Uma configuração homogênea consiste em instalar a mesma marca e modelo da GPU e configurar a mesma contagem de partições nas GPUs em todos os servidores do cluster. Por exemplo, em um cluster de dois servidores com uma ou mais GPUs instaladas, todas as GPUs devem ter a mesma marca, modelo e tamanho. A contagem de partições em cada GPU também deve corresponder.
Limitations
Considere as seguintes limitações ao usar o recurso de particionamento de GPU:
O particionamento de GPU não é suportado se a sua configuração não for homogénea. Eis alguns exemplos de configurações não suportadas:
Mistura de GPUs de diferentes fornecedores no mesmo cluster.
Usando diferentes modelos de GPU de diferentes famílias de produtos do mesmo fornecedor no mesmo cluster.
Não é possível atribuir uma GPU física como Atribuição de Dispositivo Discreto (DDA) ou GPU particionável. Você pode atribuí-lo como DDA ou como GPU particionável, mas não ambos.
Se você atribuir mais de uma partição GPU a uma VM, cada partição aparecerá como outra GPU.
As partições são atribuídas automaticamente às VMs. Não é possível escolher uma partição específica para uma VM específica.
Podes particionar a tua GPU usando o Windows Admin Center ou usando o PowerShell. Recomendamos que utilize o Windows Admin Center para configurar e atribuir partições da GPU. O Windows Admin Center valida automaticamente uma configuração homogénea das GPUs em todos os servidores do seu cluster. Ele fornece avisos e erros apropriados para tomar qualquer ação corretiva necessária.
Se estiver usando o PowerShell para habilitar o particionamento de GPU, você deverá executar as mesmas etapas de configuração em cada servidor do cluster. Você deve garantir manualmente que a configuração homogênea seja mantida para GPUs em todos os servidores do cluster.
Ao migrar em direto uma máquina virtual com uma partição de GPU atribuída, a migração ao vivo do Hyper-V volta automaticamente a usar TCP/IP com compressão. A migração de uma máquina virtual tem o efeito potencial de aumentar a utilização da CPU de um host. Além disso, as migrações ao vivo podem levar mais tempo do que com máquinas virtuais sem partições de GPU conectadas.
Conteúdo relacionado
Para obter mais informações sobre como usar GPUs com suas VMs e particionamento de GPU, consulte: