Секционирование GPU
Область применения: Azure Stack HCI, версии 23H2 и 22H2
Секционирование GPU позволяет совместно использовать физическое устройство GPU с несколькими виртуальными машинами (виртуальными машинами). Благодаря секционированию GPU или виртуализации GPU каждая виртуальная машина получает не весь GPU, а его выделенную часть.
Функция секционирования GPU использует интерфейс виртуализации единого корневого ввода-вывода (SR-IOV), который предоставляет аппаратно-поддерживаемую границу безопасности с прогнозируемой производительностью для каждой виртуальной машины. Каждая виртуальная машина может получить доступ только к ресурсам GPU, выделенным для них, и безопасное аппаратное секционирование предотвращает несанкционированный доступ к другим виртуальным машинам.
Windows Server представляет динамическую миграцию с секционированием GPU. Существуют определенные требования для использования динамической миграции секционирования GPU. Помимо рекомендуемых рекомендаций по динамической миграции, узлы кластера должны иметь процессоры для отслеживания битов DMA входных и выходных данных (IOMMU). Например, процессоры, поддерживающие Intel VT-D или AMD-Vi. Если вы используете Windows Server и динамическую миграцию без процессоров с поддержкой IOMMU, виртуальные машины автоматически перезапускаются, где доступны ресурсы GPU.
Секционирование GPU предназначено для автономных серверов. Вы можете перенести виртуальные машины между автономными узлами для запланированного простоя; Однако для клиентов, которым требуется кластеризация для незапланированного простоя, необходимо использовать Центр обработки данных Windows Server 2025.
Когда следует использовать секционирование GPU
Некоторые рабочие нагрузки, такие как инфраструктура виртуальных рабочих столов (VDI), искусственный интеллектуальный интеллект (ИИ) и Машинное обучение (МАШИНное обучение), требуют ускорения GPU, секционирование GPU может помочь сократить общую стоимость владения для всей инфраструктуры.
Например:
Приложения VDI: распределенные пограничные клиенты выполняют базовые приложения для повышения производительности, такие как Microsoft Office и рабочие нагрузки визуализации с высокой интенсивностью графики в средах VDI, для которых требуется ускорение GPU. Для таких рабочих нагрузок можно достичь требуемого ускорения GPU с помощью секционирования DDA или GPU. С помощью секционирования GPU можно создать несколько секций и назначить каждую секцию виртуальной машине, в которой размещена среда VDI. Секционирование GPU помогает достичь требуемой плотности и масштабировать количество поддерживаемых пользователей по порядку величины.
Вывод с машинным обучением: клиенты в розничных магазинах и производственных заводах могут выполнять вывод на границе, что требует поддержки GPU для своих серверов. С помощью GPU на серверах можно запускать модели машинного обучения, чтобы получить быстрые результаты, которые можно выполнить до отправки данных в облако. Система при необходимости может передать полный набор данных для продолжения обучения и совершенствования ваших моделей машинного обучения. Наряду с DDA, где вы назначаете весь физический GPU виртуальной машине, секционирование GPU позволяет параллельно запускать несколько приложений вывода на одном GPU, но в отдельных физических секциях, тем самым используя GPU до максимального.
Поддерживаемые операционные системы на виртуальной машине
Секционирование GPU в Windows Server 2025 и более поздних версиях поддерживает следующие гостевые операционные системы:
Секционирование GPU в Azure Stack HCI поддерживает следующие гостевые операционные системы:
- Windows 10 или более поздняя версия
- Windows 10 Корпоративная нескольких сеансов или более поздних версий
- Windows Server 2019 или более поздней версии;
- Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS
Поддерживаемые графические процессоры
Следующие GPU поддерживают секционирование GPU.
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
Примечание.
Драйвер NVIDIA в настоящее время не поддерживает секционирование GPU для динамической миграции.
Мы рекомендуем работать с партнерами изготовителя оборудования (OEM) и независимыми поставщиками оборудования GPU (IHV) для планирования, заказа и настройки систем для нужных рабочих нагрузок с соответствующими конфигурациями и необходимым программным обеспечением. Тем не менее, мы поддерживаем больше GPU, если вы хотите использовать ускорение GPU с помощью дискретного назначения устройств (DDA). Обратитесь к партнерам oem и IHV, чтобы получить список gpu, поддерживающих DDA. Дополнительные сведения об использовании ускорения GPU с помощью DDA см. в разделе "Дискретное назначение устройств" (DDA).
Для повышения производительности рекомендуется создать однородную конфигурацию для gpu на всех серверах в кластере. Однородная конфигурация состоит из установки одной и той же модели gpu и настройки одного количества секций в GPU на всех серверах кластера. Например, в кластере двух серверов с одним или несколькими графическими процессорами все графические процессоры должны иметь одинаковый размер, модель и размер. Количество секций на каждом GPU также должно соответствовать.
Ограничения
При использовании функции секционирования GPU следует учитывать следующие ограничения:
Секционирование GPU не поддерживается, если конфигурация не является однородной. Ниже приведены некоторые примеры неподдерживаемых конфигураций:
Сочетание gpu от разных поставщиков в одном кластере.
Использование различных моделей GPU из разных семейств продуктов от одного поставщика в одном кластере.
Вы не можете назначить физический GPU как дискретное назначение устройств (DDA) или секционируемый GPU. Его можно назначить как DDA или как секционируемый GPU, но не оба.
Для виртуальной машины можно назначить только одну секцию GPU.
Секции автоматически назначены виртуальным машинам. Для определенной виртуальной машины нельзя выбрать определенную секцию.
- В настоящее время секционирование GPU в Azure Stack HCI не поддерживает динамическую миграцию виртуальных машин. Но виртуальные машины можно автоматически перезапустить и поместить, где доступны ресурсы GPU, если произошел сбой.
Вы можете секционирование GPU с помощью Центра администрирования Windows или PowerShell. Рекомендуется использовать Windows Admin Center для настройки и назначения секций GPU. Windows Admin Center автоматически проверяет однородную конфигурацию gpu на всех серверах кластера. Он предоставляет соответствующие предупреждения и ошибки для принятия любых необходимых действий по исправлению.
При использовании PowerShell для подготовки секционирования GPU необходимо выполнить действия по подготовке на каждом сервере в кластере. Необходимо вручную убедиться, что однородная конфигурация поддерживается для gpu на всех серверах в кластере.
- При динамической миграции виртуальной машины с назначенным разделом GPU миграция Hyper-V автоматически возвращается к использованию TCP/IP с сжатием. Перенос виртуальной машины может привести к увеличению использования ЦП узла. Кроме того, динамические миграции могут занять больше времени, чем виртуальные машины без присоединенных секций GPU.
Связанный контент
Дополнительные сведения об использовании GPU с виртуальными машинами и секционированием GPU см. в следующих разделах:
Дополнительные сведения об использовании GPU с виртуальными машинами и секционированием GPU см. в следующих разделах: