Planeamiento de la aceleración de GPU en Windows Server

Artículo
05/17/2024

Se aplica a: Windows Server 2025 (versión preliminar), Windows Server 2022, Windows Server 2016, Microsoft Hyper-V Server 2016, Windows Server 2019, Microsoft Hyper-V Server 2019

En este artículo se presentan las funcionalidades de virtualización de gráficos disponibles en Windows Server.

Cuándo se usa la aceleración de GPU

Dependiendo de su carga de trabajo, es posible que desee considerar la aceleración de GPU. Esto es lo que debe tener en cuenta antes de elegir la aceleración de GPU:

Cargas de trabajo de comunicación remota de aplicaciones y escritorios (VDI/DaaS): si va a crear un servicio de comunicación remota de aplicaciones o escritorios con Windows Server, tenga en cuenta el catálogo de aplicaciones que espera que ejecuten los usuarios. Varios tipos de aplicaciones, como las aplicaciones CAD/CAM, las aplicaciones de simulación, los juegos y las aplicaciones de representación y visualización, dependen en gran medida de la representación 3D para ofrecer una interactividad fluida y una buena respuesta. La mayoría de los clientes consideran que las GPU son una necesidad para tener una experiencia de usuario razonable con estos tipos de aplicaciones.
Cargas de trabajo de representación remota, codificación y visualización: estas cargas de trabajo orientadas a gráficos suelen depender considerablemente de las funcionalidades especializadas de una GPU, como una representación 3D eficaz y la codificación y descodificación de fotogramas, para lograr los objetivos de rendimiento y rentabilidad. Para este tipo de carga de trabajo, es posible que una sola máquina virtual (VM) habilitada para GPU pueda igualar el rendimiento de muchas máquinas virtuales de solo CPU.
Cargas de trabajo de HPC y ML: para cargas de trabajo computacionales con gran paralelismo de datos, como el entrenamiento o la inferencia de modelos de aprendizaje automático y de procesos de alto rendimiento, las GPU pueden reducir considerablemente el tiempo necesario para obtener resultados, el tiempo de inferencia y el tiempo de entrenamiento. También pueden ofrecer una mejor rentabilidad que una arquitectura de solo CPU con un nivel de rendimiento comparable. Muchos marcos de proceso de alto rendimiento (HPC) y aprendizaje automático pueden usar la aceleración de GPU; considere si la aceleración de GPU puede beneficiar a su carga de trabajo específica.

Virtualización de GPU en Windows Server

Las tecnologías de virtualización de GPU permiten la aceleración de GPU en un entorno virtualizado y normalmente se produce dentro de las máquinas virtuales. Si la carga de trabajo se virtualiza con Hyper-V, debe emplear la virtualización de gráficos para proporcionar aceleración de GPU desde la GPU física a las aplicaciones o servicios virtualizados. Sin embargo, si la carga de trabajo se ejecuta directamente en hosts físicos de Windows Server, no es preciso realizar la virtualización de gráficos, ya que tanto las aplicaciones como los servicios ya tienen acceso a las funcionalidades de GPU y a las API compatibles de forma nativa en Windows Server.

Las siguientes tecnologías de virtualización de gráficos están disponibles para las máquinas virtuales de Hyper-V en Windows Server:

Asignación de dispositivos discreta (DDA)
Particiones de GPU (GPU-P)

Además de las cargas de trabajo de máquina virtual, Windows Server también admite la aceleración de GPU de las cargas de trabajo en contenedores en Windows. Para más información, consulte Aceleración de GPU en contenedores de Windows.

Asignación de dispositivos discreta (DDA)

La asignación discreta de dispositivos (DDA) le permite dedicar una o más GPU físicas a una máquina virtual. En las implementaciones de DDA, las cargas de trabajo virtualizadas se ejecutan en el controlador nativo y normalmente tienen acceso total a la funcionalidad de la GPU. DDA ofrece el mayor nivel de compatibilidad de aplicaciones y rendimiento potencial. DDA también puede proporcionar aceleración de GPU a máquinas virtuales Linux, siempre que haya compatibilidad.

Una implementación de DDA solo puede acelerar un número limitado de máquinas virtuales, ya que cada GPU física no puede proporcionar aceleración a más de una máquina virtual. Si va a desarrollar un servicio cuya arquitectura admita máquinas virtuales compartidas, considere la posibilidad de hospedar varias cargas de trabajo aceleradas por máquina virtual. Por ejemplo, si va a crear una solución de servicios de escritorio remoto, puede mejorar la escala de usuarios mediante el uso de las funcionalidades multisesión de Windows Server para hospedar varios escritorios de usuario en cada máquina virtual. Estos usuarios comparten los beneficios de la aceleración de GPU.

Para más información, consulte estos artículos:

Particiones de GPU (GPU-P)

Importante

La creación de particiones de GPU en Windows Server 2025 está en PREVIEW. Esta información está relacionada con un producto en versión preliminar que puede modificarse considerablemente antes de su lanzamiento. Microsoft no ofrece ninguna garantía, expresa o implícita, con respecto a la información que se ofrece aquí.

A partir de Windows Server 2025, la creación de particiones de GPU permite compartir un dispositivo de GPU físico con varias máquinas virtuales (VM). Con la creación de particiones o la virtualización de GPU, cada máquina virtual obtiene una fracción dedicada del dispositivo GPU en lugar del dispositivo completo.

La creación de particiones de GPU usa la interfaz de virtualización de E/S de raíz única (SR-IOV), que proporciona un límite de seguridad respaldado por hardware con un rendimiento predecible para cada máquina virtual. Cada máquina virtual solo puede acceder a los recursos de GPU dedicados a ella y la creación de particiones segura del hardware impide el acceso no autorizado de otras máquinas virtuales.

Para obtener más información sobre la creación de particiones de GPU, consulte en estos artículos:

Comparación de particiones de DDA y GPU

Tenga en cuenta las siguientes diferencias de funcionalidades y soporte técnico entre las tecnologías de virtualización de gráficos al planear la implementación:

Descripción	Asignación discreta de dispositivos	Creación de particiones de GPU
Modelo de recurso de GPU	Solo dedicado	Partitioned
Densidad de máquinas virtuales	Baja (una o varias GPU para un máquina virtual)	Alta (una o varias GPU para muchas máquinas virtuales)
Compatibilidad de aplicaciones	Todas las funcionalidades de GPU proporcionadas por el proveedor (DX 12, OpenGL, CUDA)	Todas las funcionalidades de GPU proporcionadas por el proveedor (DX 12, OpenGL, CUDA)
AVC444	Disponible a través de directiva de grupo	Disponible a través de directiva de grupo
VRAM de GPU	Hasta la VRAM que admita la GPU	Hasta la VRAM compatible con la GPU por partición
Controlador de GPU en invitado	Controlador del proveedor de GPU (Nvidia, AMD o Intel)	Controlador del proveedor de GPU (Nvidia, AMD o Intel)

Compartir a través de