Поделиться через


Виртуальные машины с GPU на устройстве Azure Stack Edge Pro c GPU

ОБЛАСТЬ ПРИМЕНЕНИЯ:Да для Pro — SKU GPU Azure Stack Edge Pro — GPUДа для SKU Pro 2Azure Stack Edge Pro 2Да для SKU R ProAzure Stack Edge Pro R

Для рабочих нагрузок с ускорением GPU на устройстве Azure Stack Edge Pro требуется виртуальная машина GPU (виртуальная машина). В этой статье приведены общие сведения о виртуальных машинах с GPU, включая поддерживаемые ОС, драйверы GPU и размеры. Также рассматриваются варианты развертывания для виртуальных машин с GPU вместе с кластерами Kubernetes.

О виртуальных машинах с GPU

Устройства Azure Stack Edge могут быть оснащены 1 или 2 gpu Nvidia Tesla T4 или Tensor Core A2. Чтобы развернуть на этих устройствах рабочие нагрузки виртуальных машин с ускорением GPU, используйте размеры виртуальных машин, оптимизированные для GPU. Выбранная виртуальная машина GPU должна соответствовать размеру GPU на устройстве Azure Stack Edge. Дополнительные сведения см. в статье "Поддерживаемые виртуальные машины серии N".

Чтобы воспользоваться преимуществами GPU виртуальных машин Azure серии N, нужно установить графические драйверы GPU NVIDIA. Расширение драйвера GPU Nvidia устанавливает необходимые драйверы CUDA или GRID Nvidia. Расширения GPU можно установить с помощью шаблонов или портала Azure.

Вы можете установить расширение и управлять им с помощью шаблонов Azure Resource Manager после развертывания виртуальной машины. На портале Azure можно установить расширение GPU во время или после развертывания виртуальной машины. Соответствующие инструкции см. в статье Развертывание виртуальных машин с GPU на устройстве Azure Stack Edge.

Если на устройстве настроен кластер Kubernetes, ознакомьтесь с рекомендациями по развертыванию кластеров Kubernetes перед развертыванием виртуальных машин GPU.

Поддерживаемые драйверы ОС и GPU

Расширения драйверов Nvidia GPU для Windows и Linux поддерживают указанные ниже версии ОС.

Поддерживаемая ОС для расширения GPU для Windows

Это расширение поддерживает указанные ниже операционные системы. Другие версии могут работать, но не были протестированы на виртуальных машинах GPU, работающих на устройствах Azure Stack Edge.

Распределение Версия
Windows Server 2019 Основные сведения
Windows Server 2016 Основные сведения

Поддерживаемая ОС для расширения GPU для Linux

Это расширение поддерживает следующий дистрибутив ОС в зависимости от поддержки драйверов для конкретной версии ОС. Другие версии могут работать, но не были протестированы на виртуальных машинах GPU, работающих на устройствах Azure Stack Edge.

Распределение Версия
Red Hat Enterprise Linux 7,4

Примечание.

Расширение GPU ubuntu 18.04 LTS устарело. Расширение GPU больше не поддерживается на виртуальных машинах GPU Ubuntu 18.04, работающих на устройствах Azure Stack Edge. Если вы планируете использовать дистрибутив Ubuntu версии 18.04 LTS, ознакомьтесь с инструкциями по установке драйверов GPU вручную в CUDA Toolkit 12.1 с обновлением 1. Перед установкой может потребоваться скачать ключ подписи CUDA. Пример установки ключа подписывания см. в статье "Устранение неполадок с расширением GPU для виртуальных машин GPU в Azure Stack Edge Pro GPU".

Развертывание виртуальной машины с GPU

Виртуальную машину с GPU можно развернуть через портал Azure или с помощью шаблонов Azure Resource Manager. Расширение GPU устанавливается после создания виртуальной машины.

Виртуальные машины с GPU и Kubernetes

Перед развертыванием виртуальных машин с GPU на устройстве учтите перечисленные ниже моменты, если на устройстве настроен Kubernetes.

Для устройства с одним GPU возможны перечисленные ниже сценарии.

  • Создайте виртуальную машину с GPU, а затем выполните настройку Kubernetes на устройстве. В этом случае будут успешно выполнены как создание виртуальной машины GPU, так и настройка Kubernetes. В этом случае Kubernetes не будет иметь доступа к GPU.

  • Настройте Kubernetes на устройстве, за которым следует создание виртуальной машины GPU. В этом сценарии Kubernetes утверждает GPU на устройстве, и создание виртуальной машины завершится ошибкой, так как ресурсы GPU недоступны.

Для устройства с двумя GPU возможны перечисленные ниже сценарии.

  • Создайте виртуальную машину с GPU, а затем выполните настройку Kubernetes на устройстве. В этом случае созданная вами виртуальная машина с GPU возьмет под контроль один GPU на устройстве, а настройка Kubernetes успешно завершится и возьмет под контроль оставшийся GPU.

  • Создайте две виртуальные машины GPU, за которыми следует конфигурация Kubernetes на устройстве. В этом сценарии две виртуальные машины GPU утверждают, что два GPU на устройстве и Kubernetes настроены успешно без gpu.

  • Настройте Kubernetes на устройстве, за которым следует создание виртуальной машины GPU. В этом сценарии Kubernetes утверждает, что gpu на устройстве и создание виртуальной машины завершится ошибкой, так как ресурсы GPU недоступны.

Следующие шаги