Aracılığıyla paylaş


GPU bölümleme

GPU bölümleme, fiziksel bir GPU cihazını birden çok sanal makineyle (VM) paylaşmanızı sağlar. GPU bölümleme veya GPU sanallaştırma ile her VM, GPU'nun tamamı yerine GPU'nun ayrılmış bir bölümünü alır.

GPU bölümleme özelliği, her vm için tahmin edilebilir performansa sahip donanım destekli bir güvenlik sınırı sağlayan Tek Kök GÇ Sanallaştırma (SR-IOV) arabirimini kullanır. Her VM yalnızca kendilerine ayrılmış GPU kaynaklarına erişebilir ve güvenli donanım bölümleme diğer VM'ler tarafından yetkisiz erişimi engeller.

Windows Server 2025'den başlayarak, dinamik geçiş GPU bölümleme ile desteklenir ve sanal makineleri yönetmek için daha fazla esneklik sağlar. GPU bölümleme ile dinamik geçişi kullanmak için kurulumunuzun bu makalede açıklanan gereksinimleri karşıladığından emin olun. Canlı geçiş, VM'leri kapalı kalma süresi olmadan konaklar arasında taşımanızı sağlar. Bu, üretim ortamında bakım ve yük dengeleme için gereklidir.

Bu özellik, GPU kaynak ayırmayı korurken planlı VM geçişlerine olanak tanır ve minimum kapalı kalma süresi ve tutarlı performans sağlar.

GPU bölümleme, tek başına sunucular için tasarlanmıştır. VM'leri planlı kapalı kalma süresi için bağımsız düğümler arasında canlı olarak taşıyabilirsiniz, ancak planlanmamış kapalı kalma süresi için kümeleme gerektiren müşteriler için Windows Server 2025 Datacenter kullanmanız gerekir.

GPU bölümleme ne zaman kullanılır?

Sanal masaüstü altyapısı (VDI), Yapay Akıllı (AI) ve Makine Öğrenmesi (ML) çıkarımı gibi bazı iş yükleri GPU hızlandırma gerektirir. GPU bölümleme, genel altyapınızın toplam sahip olma maliyetini azaltmanıza yardımcı olabilir.

Örneğin:

  • VDI uygulamaları: Dağıtılmış uç müşterileri, Microsoft Office gibi temel üretkenlik uygulamalarını ve GPU hızlandırma gerektiren VDI ortamlarında grafik ağırlıklı görselleştirme iş yüklerini çalıştırır. Bu tür iş yükleri için DDA veya GPU bölümleme yoluyla gerekli GPU hızlandırmasını elde edebilirsiniz. GPU bölümleme ile birden çok bölüm oluşturabilir ve her bölümü bir VDI ortamını barındıran VM'ye atayabilirsiniz. GPU bölümleme, istenen yoğunluğa ulaşmanıza ve desteklenen kullanıcı sayısını bir büyüklük sırasına göre ölçeklendirmenize yardımcı olur.

  • ML ile çıkarım: Perakende mağazalarındaki ve üretim tesislerindeki müşteriler uçta çıkarım yapabilir ve bu da sunucuları için GPU desteği gerektirir. Sunucularınızda GPU kullanarak, veriler buluta gönderilmeden önce üzerinde işlem gerçekleştirilebilecek hızlı sonuçlar elde etmek için ML modellerini çalıştırabilirsiniz. ml modellerinizi yeniden eğitmeye ve geliştirmeye devam etmek için isteğe bağlı olarak tam veri kümesi aktarılabilir. Tüm fiziksel GPU'yu vm'ye ayırdığınız DDA'nın yanı sıra GPU bölümleme, aynı GPU üzerinde aynı anda birden fazla çıkarım uygulaması çalıştırmanıza, ancak ayrı donanım bölümlerinde GPU kullanımını en üst düzeye çıkarmanıza olanak tanır.

Requirements

GPU bölümleme özelliğini dinamik geçişle kullanmak için desteklenen bir CPU, işletim sistemi ve GPU'ya sahip olmanız gerekir. Aşağıdaki bölümlerde gereksinimler açıklanmaktadır.

CPU gereksinimleri

Küme konaklarınızın Giriş/Çıkış Bellek Yönetim Birimi (IOMMU) DMA bit izleme özellikli işlemcilere sahip olması gerekir. Örneğin, Intel VT-D veya AMD-Vi'yi destekleyen işlemciler. IOMMU özellikli işlemciler olmadan Windows Server ve dinamik geçiş kullanıyorsanız, GPU kaynaklarının kullanılabildiği durumlarda VM'ler otomatik olarak yeniden başlatılır.

IOMMU DMA bit izlemesini destekleyen işlemcilere örnek olarak şunlar verilebilir:

  • AMD EPYC 7002 ve üzeri (Milan)
  • 4. Nesil Intel Xeon SP (Safir Rapids)

Desteklenen konuk işletim sistemleri

Windows Server 2025 ve sonraki sürümlerde GPU bölümleme şu konuk işletim sistemlerini destekler:

  • Windows 10 veya üzeri
  • Windows 10 Enterprise çoklu oturum veya üzeri
  • Windows Server 2019 veya üzeri
  • Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS

Desteklenen GPU'lar

Aşağıdaki GPU'lar GPU bölümlemesini destekler:

  • NVIDIA A2
  • NVIDIA A10
  • NVIDIA A16
  • NVIDIA A40
  • NVIDIA L2
  • NVIDIA L4
  • NVIDIA L40
  • NVIDIA L40S

GPU bölümleme ile dinamik geçişi kullanmak için NVIDIA vGPU Software v18.x veya sonraki sürümlerde bulunan sürücüyü kullanmanız gerekir. NVIDIA sürücüsü GPU bölümleme ve dinamik geçiş özellikleri için gerekli desteği sağlar.

İş yüklerinize göre uyarlanmış sistemleri planlamak ve sipariş etmek için Orijinal Ekipman Üreticisi (OEM) iş ortaklarınızla birlikte çalışmanızı öneririz. Ayrıca, kurulumunuz için uygun yapılandırmalara ve gerekli yazılımlara sahip olduğunuzdan emin olmak için GPU Bağımsız Donanım Satıcılarına (IHV) başvurun. Ancak Ayrık Cihaz Ataması (DDA) aracılığıyla GPU hızlandırmayı kullanmak istiyorsanız daha fazla GPU'yu destekliyoruz. DDA'yi destekleyen GPU'ların listesini almak için OEM iş ortaklarınıza ve IHV'lerinize ulaşın. DDA aracılığıyla GPU hızlandırma kullanma hakkında daha fazla bilgi için bkz. Ayrık Cihaz Ataması (DDA).

En iyi performans için kümenizdeki tüm sunucularda GPU'lar için homojen bir yapılandırma oluşturmanızı öneririz. Homojen bir yapılandırma, GPU'nun aynı yapı ve modelini yüklemek ve kümedeki tüm sunucularda GPU'larda aynı bölüm sayısını yapılandırmaktır. Örneğin, bir veya daha fazla GPU'nun yüklü olduğu iki sunucu kümesinde, tüm GPU'ların aynı modele, modele ve boyuta sahip olması gerekir. Her GPU'da bölüm sayısı da eşleşmelidir.

Limitations

GPU bölümleme özelliğini kullanırken aşağıdaki sınırlamaları göz önünde bulundurun:

  • Yapılandırmanız homojen değilse GPU bölümleme desteklenmez. Desteklenmeyen yapılandırmalara bazı örnekler aşağıda verilmiştir:

    • Aynı kümedeki farklı satıcıların GPU'larını karıştırma.

    • Aynı kümedeki aynı satıcıdan farklı ürün ailelerinden farklı GPU modelleri kullanma.

  • Fiziksel GPU'yu hem Ayrık Cihaz Ataması (DDA) hem de bölümlenebilir GPU olarak atayamazsınız. Bunu DDA olarak veya bölümlenebilir GPU olarak atayabilirsiniz, ancak ikisini birden atayamayın.

  • Bir VM'ye birden fazla GPU bölümü atarsanız, her bölüm başka bir GPU olarak görünür.

  • Bölümler VM'lere otomatik olarak atanır. Belirli bir VM için belirli bir bölüm seçemezsiniz.

  • Windows Yönetim Merkezi'ni veya PowerShell'i kullanarak GPU'nuzu bölümleyebilirsiniz. GPU bölümlerini yapılandırmak ve atamak için Windows Yönetim Merkezi'ni kullanmanızı öneririz. Windows Yönetim Merkezi, kümenizdeki tüm sunucularda GPU'ların homojen bir yapılandırmasını otomatik olarak doğrular. Gerekli tüm düzeltici eylemleri uygulamak için uygun uyarılarda bulunur ve hataları gösterir.

  • GPU bölümlemini etkinleştirmek için PowerShell kullanıyorsanız, kümedeki her sunucuda aynı yapılandırma adımlarını gerçekleştirmeniz gerekir. Kümenizdeki tüm sunucularda GPU'lar için homojen yapılandırmanın korundığından el ile emin olmanız gerekir.

  • Gpu bölümü atanmış bir sanal makineyi dinamik olarak geçirirken, Hyper-V dinamik geçiş otomatik olarak sıkıştırma ile TCP/IP kullanımına geri döner. Sanal makinenin taşınması, bir konağın CPU kullanımını artırma potansiyeline sahiptir. Buna ek olarak, dinamik geçişler GPU bölümleri takılı olmayan sanal makinelerden daha uzun sürebilir.

VM'lerinizle GPU'ları kullanma ve GPU bölümleme hakkında daha fazla bilgi için bkz: