Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Секционирование GPU позволяет делить физическое устройство GPU с несколькими виртуальными машинами. Благодаря секционированию GPU или виртуализации GPU каждая виртуальная машина получает не весь GPU, а его выделенную часть.
Функция секционирования GPU использует интерфейс виртуализации единого корневого ввода-вывода (SR-IOV), который предоставляет аппаратно-поддерживаемую границу безопасности с прогнозируемой производительностью для каждой виртуальной машины. Каждая виртуальная машина может получить доступ только к ресурсам GPU, выделенным для них, и безопасное аппаратное секционирование предотвращает несанкционированный доступ к другим виртуальным машинам.
Начиная с Windows Server 2025, динамическая миграция поддерживается с секционированием GPU, что обеспечивает большую гибкость для управления виртуальными машинами. Чтобы использовать динамическую миграцию с секционированием GPU, убедитесь, что настройка соответствует требованиям, описанным в этой статье. Динамическая миграция позволяет перемещать виртуальные машины между узлами без простоя, что является важным для обслуживания и балансировки нагрузки в рабочей среде.
Эта функция позволяет выполнять запланированные миграции виртуальных машин при сохранении выделения ресурсов GPU, обеспечивая минимальное время простоя и согласованную производительность.
Секционирование GPU предназначено для автономных серверов. Вы можете перенести виртуальные машины между автономными узлами для запланированного простоя; Однако для клиентов, которым требуется кластеризация для незапланированного простоя, необходимо использовать Windows Server 2025 Datacenter.
Когда следует использовать секционирование GPU
Некоторые рабочие нагрузки, такие как инфраструктура виртуальных рабочих столов (VDI), искусственный интеллект (ИИ) и машинное обучение (ML), требуют ускорения GPU. Разделение GPU может помочь сократить общую стоимость владения для всей инфраструктуры.
Рассмотрим пример.
Приложения VDI: распределенные пограничные клиенты выполняют базовые приложения для повышения производительности, такие как Microsoft Office и рабочие нагрузки визуализации с высокой графикой в средах VDI, для которых требуется ускорение GPU. Для таких рабочих нагрузок можно достичь требуемого ускорения GPU с помощью DDA или секционирования GPU. С помощью секционирования GPU можно создать несколько секций и назначить каждую секцию виртуальной машине, в которой размещена среда VDI. Секционирование GPU помогает достичь требуемой плотности и масштабировать количество поддерживаемых пользователей по порядку величины.
Инференция с использованием машинного обучения: клиенты в розничных магазинах и производственных предприятиях могут выполнять инференцию на периферии, что требует поддержки GPU для их серверов. С помощью GPU на серверах можно запускать модели машинного обучения, чтобы получить быстрые результаты, которые можно выполнить до отправки данных в облако. Система при необходимости может передать полный набор данных для продолжения обучения и совершенствования ваших моделей машинного обучения. Наряду с DDA, где вы выделяете весь физический GPU виртуальной машине, секционирование GPU позволяет одновременно запускать несколько приложений вывода на одном GPU, но в отдельных аппаратных секциях, максимизируя использование GPU.
Requirements
Чтобы использовать секционирование GPU с динамической миграцией, необходимо иметь поддерживаемую ЦП, операционную систему и GPU. В следующих разделах описаны требования.
Требования к ЦП
Узлы кластера должны иметь процессоры с поддержкой отслеживания битов DMA и управления памятью с помощью модуля управления входными/выходными операциями памяти (IOMMU). Например, процессоры, поддерживающие Intel VT-D или AMD-Vi. Если вы используете Windows Server и динамическую миграцию без процессоров с поддержкой IOMMU, виртуальные машины автоматически перезапускаются, где доступны ресурсы GPU.
Примеры процессоров, поддерживающих отслеживание битов IOMMU DMA для динамической миграции с секционированием GPU, включают:
- AMD EPYC 7003 и более поздних версий (Милан)
- 4-го поколения Intel Xeon SP (Sapphire Rapids)
Процессоры AMD EPYC 7002 (Rome) поддерживают секционирование GPU, но они не поддерживают динамическую миграцию с секционированием GPU.
Поддерживаемые гостевые операционные системы
Секционирование GPU на Windows Server 2025 и более поздних версий поддерживает следующие гостевые операционные системы:
- Windows 10 или более поздней версии
- Windows 10 Enterprise с несколькими сеансами или более поздняя версия
- Windows Server 2019 или более поздней версии
- Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS
Поддерживаемые графические процессоры
Следующие GPU поддерживают секционирование GPU.
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
- NVIDIA RTX Pro 6000 Blackwell Server Edition
- AMD V710
Чтобы использовать динамическую миграцию с секционированием GPU для GPU NVIDIA, необходимо использовать драйвер, включенный в программное обеспечение NVIDIA vGPU версии 18.x или более поздней версии. Драйвер NVIDIA обеспечивает необходимую поддержку секционирования и динамической миграции GPU.
Мы рекомендуем работать с партнерами изготовителя оборудования (OEM) для планирования и заказа систем, адаптированных к рабочим нагрузкам. Кроме того, обратитесь к независимым поставщикам оборудования GPU (IHV), чтобы убедиться, что у вас есть соответствующие конфигурации и необходимое программное обеспечение для настройки. Тем не менее, мы поддерживаем больше GPU, если вы хотите использовать ускорение GPU с помощью дискретного назначения устройств (DDA). Обратитесь к партнерам oem и IHV, чтобы получить список gpu, поддерживающих DDA. Дополнительные сведения об использовании ускорения GPU с помощью DDA см. в разделе "Дискретное назначение устройств" (DDA).
Для повышения производительности рекомендуется создать однородную конфигурацию для gpu на всех серверах в кластере. Однородная конфигурация состоит из установки одной и той же модели gpu и настройки одного количества секций в GPU на всех серверах кластера. Например, в кластере из двух серверов с одним или несколькими графическими процессорами все графические процессоры должны иметь одинакового производителя, модель и размер. Количество разделов на каждом GPU также должно соответствовать.
Limitations
При использовании функции секционирования GPU следует учитывать следующие ограничения:
Секционирование GPU не поддерживается, если конфигурация не является однородной. Ниже приведены некоторые примеры неподдерживаемых конфигураций:
Сочетание графических процессоров (ГПУ) от различных поставщиков в одном кластере.
Использование различных моделей GPU из разных семейств продуктов от одного поставщика в одном кластере.
Вы не можете назначить физический GPU как дискретное назначение устройств (DDA) или секционируемый GPU. Его можно назначить как DDA или как секционируемый GPU, но не оба.
Если назначить виртуальной машине несколько секций GPU, каждая секция будет отображаться в виде другого GPU.
Разделы автоматически назначены виртуальным машинам. Для определенной виртуальной машины нельзя выбрать определенную секцию.
Вы можете разделить GPU с помощью Windows Admin Center или PowerShell. Рекомендуется использовать Windows Admin Center для настройки и назначения секций GPU. Windows Admin Center автоматически проверяет однородную конфигурацию gpu на всех серверах в кластере. Он предоставляет соответствующие предупреждения и ошибки для принятия любых необходимых действий по исправлению.
При использовании PowerShell для включения секционирования GPU необходимо выполнить те же действия конфигурации на каждом сервере в кластере. Необходимо вручную убедиться, что однородная конфигурация поддерживается для gpu на всех серверах в кластере.
При живой миграции виртуальной машины с назначенным разделом GPU Hyper-V автоматически переключается на использование TCP/IP с сжатием. Перенос виртуальной машины может привести к увеличению использования ЦП узла. Кроме того, динамические миграции могут занять больше времени, чем виртуальные машины без присоединенных секций GPU.
Связанный контент
Дополнительные сведения об использовании GPU с виртуальными машинами и секционированием GPU см. в следующих разделах: