Dela via


GPU-partition

Med GPU-partitionering kan du dela en fysisk GPU-enhet med flera virtuella datorer . Med GPU-partitionering eller GPU-virtualisering får varje virtuell dator en dedikerad del av GPU:n i stället för hela GPU:n.

GPU-partitioneringsfunktionen använder gränssnittet single root IO Virtualization (SR-IOV), som ger en maskinvarubaserad säkerhetsgräns med förutsägbara prestanda för varje virtuell dator. Varje virtuell dator kan endast komma åt de GPU-resurser som är dedikerade till dem och den säkra maskinvarupartitioneringen förhindrar obehörig åtkomst från andra virtuella datorer.

Från och med Windows Server 2025 stöds direktmigrering med GPU-partitionering, vilket ger större flexibilitet för hantering av virtuella datorer. Om du vill använda direktmigrering med GPU-partitionering kontrollerar du att konfigurationen uppfyller de krav som beskrivs i den här artikeln. Med direktmigrering kan du flytta virtuella datorer mellan värdar utan stilleståndstid, vilket är viktigt för underhåll och belastningsutjämning i en produktionsmiljö.

Den här funktionen tillåter planerade VM-migreringar samtidigt som GPU-resursallokering upprätthålls, vilket ger minimal stilleståndstid och konsekventa prestanda.

GPU-partitionering är utformat för fristående servrar. Du kan direktmigrera virtuella datorer mellan fristående noder för planerad stilleståndstid. Men för kunder som kräver klustring för oplanerad stilleståndstid måste du använda Windows Server 2025 Datacenter.

När GPU-partitionering ska användas

Vissa arbetsbelastningar, till exempel VDI (Virtual Desktop Infrastructure), Artificial Intelligent (AI) och Machine Learning (ML) inferens kräver GPU-acceleration, GPU-partitionering kan bidra till att minska den totala ägandekostnaden för din övergripande infrastruktur.

Till exempel:

  • VDI-program: Distribuerade edge-kunder kör grundläggande produktivitetsappar, till exempel Microsoft Office och grafikintensiva visualiseringsarbetsbelastningar i sina VDI-miljöer, vilket kräver GPU-acceleration. För sådana arbetsbelastningar kan du uppnå den GPU-acceleration som krävs via DDA- eller GPU-partitionering. Med GPU-partitionering kan du skapa flera partitioner och tilldela varje partition till en virtuell dator som är värd för en VDI-miljö. GPU-partitionering hjälper dig att uppnå önskad densitet och skala antalet användare som stöds efter storleksordning.

  • Slutsatsdragning med ML: Kunder i butiker och tillverkningsanläggningar kan köra slutsatsdragning vid gränsen, vilket kräver GPU-stöd för sina servrar. Med GPU på dina servrar kan du köra ML-modeller för att få snabba resultat som kan utföras innan data skickas till molnet. Du kan också överföra den fullständiga datauppsättningen för att fortsätta träna om och förbättra DINA ML-modeller. Tillsammans med DDA, där du ägnar en hel fysisk GPU till en virtuell dator, gör GPU-partitionering att du kan köra flera slutsatsdragningsprogram samtidigt på samma GPU, men i separata maskinvarupartitioner, vilket maximerar GPU-användningen.

Requirements

Om du vill använda GPU-partitionering med direktmigrering måste du ha en processor, ett operativsystem och en GPU som stöds. I följande avsnitt beskrivs kraven.

CPU-krav

Klustervärdarna måste ha DMA-bitspårningskompatibla processorer (Input/Output Memory Management Unit) (IOMMU). Till exempel processorer som stöder Intel VT-D eller AMD-Vi. Om du använder Windows Server och direktmigrering utan IOMMU-aktiverade processorer startas de virtuella datorerna automatiskt om där GPU-resurser är tillgängliga.

Exempel på processorer som stöder IOMMU DMA-bitspårning är:

  • AMD EPYC 7002 och senare (Milano)
  • 4. Gen Intel Xeon SP (Sapphire Rapids)

Gästoperativsystem som stöds

GPU-partitionering på Windows Server 2025 och senare stöder följande gästoperativsystem:

  • Windows 10 eller senare
  • Windows 10 Enterprise flera sessioner eller senare
  • Windows Server 2019 eller senare
  • Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS

GPU:er som stöds

Följande GPU:er stöder GPU-partitionering:

  • NVIDIA A2
  • NVIDIA A10
  • NVIDIA A16
  • NVIDIA A40
  • NVIDIA L2
  • NVIDIA L4
  • NVIDIA L40
  • NVIDIA L40S

Om du vill använda direktmigrering med GPU-partitionering måste du använda drivrutinen som ingår i NVIDIA vGPU Software v18.x eller senare. NVIDIA-drivrutinen ger det stöd som krävs för GPU-partitionering och direktmigreringsfunktioner.

Vi rekommenderar att du samarbetar med oem-partner (Original Equipment Manufacturer) för att planera och beställa system som är skräddarsydda för dina arbetsbelastningar. Du kan också kontakta GPU Independent Hardware Vendors (IHVs) för att se till att du har rätt konfigurationer och nödvändig programvara för din konfiguration. Vi stöder dock fler GPU:er om du vill använda GPU-acceleration via diskret enhetstilldelning (DDA). Kontakta dina OEM-partner och IHV:er för att få en lista över GPU:er som stöder DDA. Mer information om hur du använder GPU-acceleration via DDA finns i Diskret enhetstilldelning (DDA).

För bästa prestanda rekommenderar vi att du skapar en homogen konfiguration för GPU:er på alla servrar i klustret. En homogen konfiguration består av att installera samma märke och modell för GPU:n och konfigurera samma partitionsantal i GPU:erna på alla servrar i klustret. I ett kluster med två servrar med en eller flera GPU:er installerade måste alla GPU:er ha samma märke, modell och storlek. Partitionsantalet för varje GPU måste också matcha.

Limitations

Tänk på följande begränsningar när du använder GPU-partitioneringsfunktionen:

  • GPU-partitionering stöds inte om konfigurationen inte är homogen. Här följer några exempel på konfigurationer som inte stöds:

    • Blanda GPU:er från olika leverantörer i samma kluster.

    • Använda olika GPU-modeller från olika produktfamiljer från samma leverantör i samma kluster.

  • Du kan inte tilldela en fysisk GPU som både Diskret enhetstilldelning (DDA) och partitionsbar GPU. Du kan antingen tilldela den som DDA eller som partitionsbar GPU, men inte båda.

  • Om du tilldelar mer än en GPU-partition till en virtuell dator visas varje partition som en annan GPU.

  • Partitioner tilldelas automatiskt till de virtuella datorerna. Du kan inte välja en specifik partition för en specifik virtuell dator.

  • Du kan partitionera din GPU med hjälp av Windows Administrationscenter eller med hjälp av PowerShell. Vi rekommenderar att du använder Windows Admin Center för att konfigurera och tilldela GPU-partitioner. Windows Admin Center validerar automatiskt för en homogen konfiguration av GPU:er för alla servrar i klustret. Den innehåller lämpliga varningar och fel för att vidta eventuella korrigerande åtgärder som behövs.

  • Om du använder PowerShell för att aktivera GPU-partitionering måste du utföra samma konfigurationssteg på varje server i klustret. Du måste manuellt se till att den homogena konfigurationen underhålls för GPU:er på alla servrar i klustret.

  • Vid direktmigrering av en virtuell dator med en tilldelad GPU-partition återgår Hyper-V direktmigrering automatiskt till att använda TCP/IP med komprimering. Att migrera en virtuell dator har den potentiella effekten att öka processoranvändningen för en värd. Dessutom kan direktmigreringar ta längre tid än med virtuella datorer utan att GPU-partitioner är anslutna.

Mer information om hur du använder GPU:er med dina virtuella datorer och GPU-partitionering finns i: