Merencanakan akselerasi GPU di Windows Server

Artikel
11/02/2024
Berlaku untuk:

✅ Windows Server 2025, ✅ Windows Server 2022, ✅ Windows Server 2019, ✅ Windows Server 2016, ✅ Azure Stack HCI, versions 23H2 and 22H2

Artikel ini memperkenalkan kemampuan virtualisasi grafis yang tersedia di Windows Server.

Kapan menggunakan akselerasi GPU

Bergantung pada beban kerja Anda, Anda mungkin ingin mempertimbangkan akselerasi GPU. Inilah yang harus Anda pertimbangkan sebelum memilih akselerasi GPU:

Beban kerja jarak jauh aplikasi dan desktop (VDI/DaaS): Jika Anda membangun layanan jarak jauh aplikasi atau desktop dengan Windows Server, pertimbangkan katalog aplikasi yang Anda harapkan dijalankan pengguna Anda. Beberapa jenis aplikasi, seperti aplikasi CAD/CAM, aplikasi simulasi, game, dan aplikasi rendering/visualisasi, sangat bergantung pada penyajian 3D untuk memberikan interaktivitas yang lancar dan responsif. Sebagian besar pelanggan menganggap GPU sebagai kebutuhan untuk pengalaman pengguna yang wajar dengan jenis aplikasi ini.
Beban kerja rendering, pengodean, dan visualisasi jarak jauh: Beban kerja berorientasi grafis ini cenderung sangat bergantung pada kemampuan khusus GPU, seperti penyajian 3D yang efisien dan pengodean/dekode bingkai, untuk mencapai tujuan efektivitas biaya dan throughput. Untuk beban kerja semacam ini, satu komputer virtual (VM) berkemampuan GPU mungkin dapat mencocokkan throughput banyak VM khusus CPU.
Beban kerja HPC dan ML: Untuk beban kerja komputasi yang sangat paralel data, seperti komputasi berperforma tinggi dan pelatihan atau inferensi model pembelajaran mesin, GPU dapat secara dramatis mempersingkat waktu hingga hasil, waktu inferensi, dan waktu pelatihan. Atau, mereka mungkin menawarkan efektivitas biaya yang lebih baik daripada arsitektur khusus CPU pada tingkat performa yang sebanding. Banyak Komputasi Performa Tinggi (HPC) dan kerangka kerja pembelajaran mesin dapat menggunakan akselerasi GPU; pertimbangkan apakah akselerasi GPU mungkin menguntungkan beban kerja spesifik Anda.

Virtualisasi GPU di Windows Server

Teknologi virtualisasi GPU memungkinkan akselerasi GPU di lingkungan virtual, biasanya dalam komputer virtual. Jika beban kerja Anda divirtualisasi dengan Hyper-V, maka Anda perlu menggunakan virtualisasi grafis untuk menyediakan akselerasi GPU dari GPU fisik ke aplikasi atau layanan virtual Anda. Namun, jika beban kerja Anda berjalan langsung di host Windows Server fisik, maka Anda tidak perlu virtualisasi grafis; aplikasi dan layanan Anda sudah memiliki akses ke kemampuan GPU dan API yang didukung secara asli di Windows Server.

Teknologi virtualisasi grafis berikut tersedia untuk VM Hyper-V di Windows Server:

Penugasan Perangkat Diskrit (DDA)
Pemartisian GPU (GPU-P)

Selain beban kerja VM, Windows Server juga mendukung akselerasi GPU beban kerja dalam kontainer dalam Kontainer Windows. Untuk informasi selengkapnya, lihat Akselerasi GPU di kontainer Windows.

Penugasan Perangkat Diskrit (DDA)

Penugasan Perangkat Diskrit (DDA) memungkinkan Anda mendedikasikan satu atau beberapa GPU fisik ke komputer virtual. Dalam penyebaran DDA, beban kerja virtual berjalan pada driver asli dan biasanya memiliki akses penuh ke fungsionalitas GPU. DDA menawarkan tingkat kompatibilitas aplikasi tertinggi dan performa potensial. DDA juga dapat menyediakan akselerasi GPU ke VM Linux, yang tunduk pada dukungan.

Penyebaran DDA hanya dapat mempercepat sejumlah komputer virtual terbatas, karena setiap GPU fisik dapat memberikan akselerasi ke paling banyak satu VM. Jika Anda mengembangkan layanan yang arsitekturnya mendukung komputer virtual bersama, pertimbangkan untuk menghosting beberapa beban kerja yang dipercepat per VM. Misalnya, jika Anda membangun solusi Layanan Desktop Jarak Jauh, Anda dapat meningkatkan skala pengguna dengan menggunakan kemampuan multi-sesi Windows Server untuk menghosting beberapa desktop pengguna di setiap VM. Pengguna ini berbagi manfaat akselerasi GPU.

Untuk informasi selengkapnya, lihat artikel berikut ini:

Pemartisian GPU (GPU-P)

Dimulai dengan Windows Server 2025, pemartisian GPU memungkinkan Anda berbagi perangkat GPU fisik dengan beberapa komputer virtual (VM). Dengan pemartisian GPU atau virtualisasi GPU, setiap VM mendapatkan bagian khusus dari GPU alih-alih seluruh GPU.

Pemartisian GPU menggunakan antarmuka Virtualisasi IO Akar Tunggal (SR-IOV), yang menyediakan batas keamanan yang didukung perangkat keras dengan performa yang dapat diprediksi untuk setiap VM. Setiap VM hanya dapat mengakses sumber daya GPU yang didedikasikan untuk mereka dan partisi perangkat keras yang aman mencegah akses yang tidak sah oleh VM lain.

Untuk mempelajari selengkapnya tentang pemartisian GPU, lihat artikel berikut ini:

Membandingkan partisi DDA dan GPU

Pertimbangkan fungsionalitas berikut dan perbedaan dukungan antara teknologi virtualisasi grafis saat merencanakan penyebaran Anda:

Deskripsi	Penetapan Perangkat Diskrit	Pemartisian GPU
Model sumber daya GPU	Khusus	Dipartisi
Kepadatan VM	Rendah (satu atau beberapa GPU ke satu VM)	Tinggi (satu atau beberapa GPU ke banyak VM)
Kompatibilitas aplikasi	Semua kemampuan GPU yang disediakan oleh vendor (DX 12, OpenGL, CUDA)	Semua kemampuan GPU yang disediakan oleh vendor (DX 12, OpenGL, CUDA)
AVC444	Tersedia melalui Kebijakan Grup	Tersedia melalui Kebijakan Grup
GPU VRAM	Hingga VRAM yang didukung oleh GPU	Hingga VRAM yang didukung oleh GPU per partisi
Driver GPU di tamu	GPU vendor driver (NVIDIA, AMD, Intel)	GPU vendor driver (NVIDIA, AMD, Intel)

Bagikan melalui