Merencanakan akselerasi GPU di Windows Server
Artikel ini memperkenalkan kemampuan virtualisasi grafis yang tersedia di Windows Server.
Kapan menggunakan akselerasi GPU
Bergantung pada beban kerja Anda, Anda mungkin ingin mempertimbangkan akselerasi GPU. Inilah yang harus Anda pertimbangkan sebelum memilih akselerasi GPU:
- Beban kerja jarak jauh aplikasi dan desktop (VDI/DaaS): Jika Anda membangun layanan jarak jauh aplikasi atau desktop dengan Windows Server, pertimbangkan katalog aplikasi yang Anda harapkan dijalankan pengguna Anda. Beberapa jenis aplikasi, seperti aplikasi CAD/CAM, aplikasi simulasi, game, dan aplikasi rendering/visualisasi, sangat bergantung pada penyajian 3D untuk memberikan interaktivitas yang lancar dan responsif. Sebagian besar pelanggan menganggap GPU sebagai kebutuhan untuk pengalaman pengguna yang wajar dengan jenis aplikasi ini.
- Beban kerja rendering, pengodean, dan visualisasi jarak jauh: Beban kerja berorientasi grafis ini cenderung sangat bergantung pada kemampuan khusus GPU, seperti penyajian 3D yang efisien dan pengodean/dekode bingkai, untuk mencapai tujuan efektivitas biaya dan throughput. Untuk beban kerja semacam ini, satu komputer virtual (VM) berkemampuan GPU mungkin dapat mencocokkan throughput banyak VM khusus CPU.
- Beban kerja HPC dan ML: Untuk beban kerja komputasi yang sangat paralel data, seperti komputasi berperforma tinggi dan pelatihan atau inferensi model pembelajaran mesin, GPU dapat secara dramatis mempersingkat waktu hingga hasil, waktu inferensi, dan waktu pelatihan. Atau, mereka mungkin menawarkan efektivitas biaya yang lebih baik daripada arsitektur khusus CPU pada tingkat performa yang sebanding. Banyak Komputasi Performa Tinggi (HPC) dan kerangka kerja pembelajaran mesin dapat menggunakan akselerasi GPU; pertimbangkan apakah akselerasi GPU mungkin menguntungkan beban kerja spesifik Anda.
Virtualisasi GPU di Windows Server
Teknologi virtualisasi GPU memungkinkan akselerasi GPU di lingkungan virtual, biasanya dalam komputer virtual. Jika beban kerja Anda divirtualisasi dengan Hyper-V, maka Anda perlu menggunakan virtualisasi grafis untuk menyediakan akselerasi GPU dari GPU fisik ke aplikasi atau layanan virtual Anda. Namun, jika beban kerja Anda berjalan langsung di host Windows Server fisik, maka Anda tidak perlu virtualisasi grafis; aplikasi dan layanan Anda sudah memiliki akses ke kemampuan GPU dan API yang didukung secara asli di Windows Server.
Teknologi virtualisasi grafis berikut tersedia untuk VM Hyper-V di Windows Server:
Selain beban kerja VM, Windows Server juga mendukung akselerasi GPU beban kerja dalam kontainer dalam Kontainer Windows. Untuk informasi selengkapnya, lihat Akselerasi GPU di kontainer Windows.
Penugasan Perangkat Diskrit (DDA)
Penugasan Perangkat Diskrit (DDA) memungkinkan Anda mendedikasikan satu atau beberapa GPU fisik ke komputer virtual. Dalam penyebaran DDA, beban kerja virtual berjalan pada driver asli dan biasanya memiliki akses penuh ke fungsionalitas GPU. DDA menawarkan tingkat kompatibilitas aplikasi tertinggi dan performa potensial. DDA juga dapat menyediakan akselerasi GPU ke VM Linux, yang tunduk pada dukungan.
Penyebaran DDA hanya dapat mempercepat sejumlah komputer virtual terbatas, karena setiap GPU fisik dapat memberikan akselerasi ke paling banyak satu VM. Jika Anda mengembangkan layanan yang arsitekturnya mendukung komputer virtual bersama, pertimbangkan untuk menghosting beberapa beban kerja yang dipercepat per VM. Misalnya, jika Anda membangun solusi Layanan Desktop Jarak Jauh, Anda dapat meningkatkan skala pengguna dengan menggunakan kemampuan multi-sesi Windows Server untuk menghosting beberapa desktop pengguna di setiap VM. Pengguna ini berbagi manfaat akselerasi GPU.
Untuk informasi selengkapnya, lihat artikel berikut ini:
- Rencanakan untuk menyebarkan Penugasan Perangkat Diskrit
- Menyebarkan perangkat grafis menggunakan Penugasan Perangkat Diskrit
Pemartisian GPU (GPU-P)
Dimulai dengan Windows Server 2025, pemartisian GPU memungkinkan Anda berbagi perangkat GPU fisik dengan beberapa komputer virtual (VM). Dengan pemartisian GPU atau virtualisasi GPU, setiap VM mendapatkan bagian khusus dari GPU alih-alih seluruh GPU.
Pemartisian GPU menggunakan antarmuka Virtualisasi IO Akar Tunggal (SR-IOV), yang menyediakan batas keamanan yang didukung perangkat keras dengan performa yang dapat diprediksi untuk setiap VM. Setiap VM hanya dapat mengakses sumber daya GPU yang didedikasikan untuk mereka dan partisi perangkat keras yang aman mencegah akses yang tidak sah oleh VM lain.
Untuk mempelajari selengkapnya tentang pemartisian GPU, lihat artikel berikut ini:
Membandingkan partisi DDA dan GPU
Pertimbangkan fungsionalitas berikut dan perbedaan dukungan antara teknologi virtualisasi grafis saat merencanakan penyebaran Anda:
Deskripsi | Penetapan Perangkat Diskrit | Pemartisian GPU |
---|---|---|
Model sumber daya GPU | Khusus | Dipartisi |
Kepadatan VM | Rendah (satu atau beberapa GPU ke satu VM) | Tinggi (satu atau beberapa GPU ke banyak VM) |
Kompatibilitas aplikasi | Semua kemampuan GPU yang disediakan oleh vendor (DX 12, OpenGL, CUDA) | Semua kemampuan GPU yang disediakan oleh vendor (DX 12, OpenGL, CUDA) |
AVC444 | Tersedia melalui Kebijakan Grup | Tersedia melalui Kebijakan Grup |
GPU VRAM | Hingga VRAM yang didukung oleh GPU | Hingga VRAM yang didukung oleh GPU per partisi |
Driver GPU di tamu | GPU vendor driver (NVIDIA, AMD, Intel) | GPU vendor driver (NVIDIA, AMD, Intel) |