Установка драйверов GPU AMD на виртуальных машинах Linux серии NVads версии 710

Область применения: ✔️ виртуальные машины Linux

Это важно

Чтобы соответствовать инклюзивной языковой практике, мы заменили термин "черный список" на "блок-список" в этой документации. Это изменение отражает нашу приверженность предотвращению терминологии, которая может нести непреднамеренные отрицательные коннотации или воспринимаемую расовую предвзятость. Однако в фрагментах кода и технических ссылках, где "черный список" является частью установленного синтаксиса или инструментов (например, файлов конфигурации, параметров командной строки), исходный термин сохраняется для сохранения функциональной точности. Это использование строго техническое и не подразумевает никаких дискриминационных намерений.

Серия NVads V710

Чтобы использовать возможности GPU новых виртуальных машин серии NVads версии 710 серии Azure под управлением Linux, необходимо установить драйверы GPU AMD. Расширение драйвера GPU AMD упрощает этот процесс путем автоматизации установки драйверов для виртуальных машин серии NVv710. Вы можете управлять расширением с помощью портала Azure, Azure PowerShell или шаблонов Azure Resource Manager (ARM). Дополнительные сведения о поддерживаемых операционных системах и шагах развертывания см. в документации по расширению драйвера GPU AMD .

Образ Marketplace предварительно установлен с драйвером GPU AMD, что способствует ускорению настройки виртуальной машины. В этом руководстве объясняется, как установить драйверы GPU AMD на виртуальных машинах Linux серии NVads версии 710. Он охватывает как автоматизированные, так и вручную методы установки специально для Ubuntu.

ROCm

Примечание.

В настоящее время Azure предоставляет инструкции по установке:

  • Ubuntu 22.04
  • Ubuntu 24.04

Сведения о других дистрибутивах Linux см. в статье:

Установите драйвер AMD Linux, чтобы использовать полные возможности GPU AMD Radeon PRO V710 на экземпляре Linux NVv5-V710 GPU в Microsoft Azure. В разделах, приведенных ниже, приведены подробные инструкции по установке драйвера Linux и выполнению рабочих нагрузок вывода с помощью ROCm в этом типе экземпляра.

Параметры быстрого запуска

Вариант 1. Использование расширения драйвера GPU AMD

Самый простой метод — использовать расширение драйвера GPU AMD, которое автоматизирует установку драйверов для виртуальных машин серии NVv710. Вы можете развернуть это расширение следующими способами:

  • Портал Azure
  • Azure PowerShell
  • Шаблоны диспетчера ресурсов Azure

Вариант 2. Использование предварительно настроенного образа Marketplace

Образ Marketplace доступен с предварительно установленными драйверами GPU AMD, что позволяет ускорить развертывание виртуальных машин.

Вариант 3. Установка вручную

Следуйте этим инструкциям по установке и настройке драйвера вручную.


Установка драйвера ROCM

Предпосылки

Требования к системе:

  • Размер диска должен превышать 64 ГБ для оптимальной производительности.
  • Поддерживаемые дистрибутивы: Ubuntu 22.04 или Ubuntu 24.04
  • Идентификатор устройства виртуальной функции: 7461 (AMD Radeon PRO V710 GPU)

Шаг 1. Проверка системы

Выполните следующие действия, чтобы убедиться, что карта GPU обнаружена в системе.

  1. Проверьте дистрибутив Linux:

    cat /etc/*release
    
  2. Проверьте версию ядра:

    uname -srmv
    
  3. Убедитесь, что ваша карта GPU обнаружена:

    sudo lspci -d 1002:7461
    

    Выходные данные должны выглядеть примерно так:

    c3:00.0 Display controller: Advanced Micro Devices, Inc. [AMD/ATI] Device 7461
    

Шаг 2. Установка драйвера

Команды установки драйвера немного отличаются в зависимости от того, используете ли вы Ubuntu 22.04 или 24.04.

Для Ubuntu 22.04

sudo apt update
sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"
sudo apt install python3-setuptools python3-wheel
sudo usermod -a -G render,video $LOGNAME
wget https://repo.radeon.com/amdgpu-install/7.2.2/ubuntu/jammy/amdgpu-install_7.2.2.70202-1_all.deb
sudo apt install ./amdgpu-install_7.2.2.70202-1_all.deb
sudo sed -i "s|graphics/7.2.2|graphics/7.2.1|" /etc/apt/sources.list.d/rocm.list
sudo apt update
sudo apt install amdgpu-dkms rocm

Для Ubuntu 24.04

sudo apt update
sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"
sudo apt install python3-setuptools python3-wheel
sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups
wget https://repo.radeon.com/amdgpu-install/7.2.2/ubuntu/noble/amdgpu-install_7.2.2.70202-1_all.deb
sudo apt install ./amdgpu-install_7.2.2.70202-1_all.deb
sudo sed -i "s|graphics/7.2.2|graphics/7.2.1|" /etc/apt/sources.list.d/rocm.list
sudo apt update
sudo apt install amdgpu-dkms rocm

Шаг 3. Загрузка и проверка драйвера

Выполните следующие действия, чтобы загрузить и проверить драйвер.

  1. Загрузите драйвер:

    sudo modprobe amdgpu
    
  2. Убедитесь, что драйвер успешно загружен:

    sudo dmesg | grep amdgpu
    
  3. Проверьте состояние драйвера с помощью AMD-SMI:

    amd-smi monitor
    

Шаг 4. Включение автоматической загрузки при перезагрузке

Выполните следующие действия, чтобы включить автоматическую загрузку при перезагрузке.

  1. Выполните поиск записей списка блокировок:

    grep amdgpu /etc/modprobe.d/* -rn
    
  2. Если драйвер заблокирован, удалите список блокировок:

    sudo nano /etc/modprobe.d/blacklist.conf
    
  3. Удалите строку, содержащую blacklist amdgpu, а затем обновите initramfs:

    sudo update-initramfs -uk all
    
  4. Перезагрузите, чтобы применить изменения:

    sudo reboot
    

Установка графических драйверов и ROCm

В этом разделе описывается установка драйвера AMD для графических рабочих нагрузок с помощью библиотек ROCm и средств разработки.

Предпосылки

Требования к системе:

  • Ubuntu 24.04 с ядром 6.8
  • Размер диска больше 64 ГБ
  • Среда рабочего стола (для графических рабочих нагрузок используйте ISO Ubuntu Desktop)

Этапы предварительной установки

Выполните следующие действия перед установкой.

  1. Обновление списка пакетов:

    sudo apt update
    
  2. Установка пакетов Python:

    sudo apt install python3-setuptools python3-wheel
    
  3. Добавьте пользователя в необходимые группы:

    sudo usermod -a -G render,video $LOGNAME
    
  4. Установите заголовки ядра:

    sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"
    

Установка драйвера AMD с поддержкой графики

Выполните следующие действия, чтобы установить драйвер AMD с поддержкой графики.

  1. Обновите систему:

    sudo apt upgrade
    
  2. Скачайте установщик:

    wget -N -P /tmp/  https://repo.radeon.com/amdgpu-install/.6.4.2.2/ubuntu/noble/amdgpu-install_6.4.2.2.60402-1_all.deb
    
  3. Если предыдущий драйвер существует, удалите его:

    sudo amdgpu-uninstall
    sudo apt remove amdgpu-install --purge
    
  4. Установите новый драйвер:

    sudo apt-get install /tmp/amdgpu-install_6.4.2.2.60402-1_all.deb
    sudo amdgpu-setup -b https://repo.radeon.com/.hidden/7870d5fc33d4766bda9336f8ad1c990e
    sudo gpg --keyserver keyserver.ubuntu.com --recv-keys 9386B48A1A693C5C
    sudo gpg --export --armor 9386B48A1A693C5C | sudo tee /etc/apt/trusted.gpg.d/amdgpu.asc
    sudo amdgpu-install --usecase=workstation,rocm,amf --opencl=rocr --vulkan=pro --no-32 --accept-eula
    
  5. Загрузите драйвер:

    sudo modprobe amdgpu
    
  6. Проверьте установку:

    sudo dmesg | grep amdgpu
    

Чтобы удалить список блокировок, см. статью "Включить автоматическую загрузку при перезагрузке".


Конфигурация удаленного сервера X11

После установки графического драйвера выполните следующие действия, чтобы настроить виртуальный дисплей с аппаратным ускорением для удаленного доступа.

Шаг 1. Установка необходимых пакетов

sudo apt install net-tools
sudo apt install x11vnc

Шаг 2. Настройка GDM3

Выполните следующие действия, чтобы настроить GDM3.

  1. Измените конфигурацию GDM3:

    sudo vim /etc/gdm3/custom.conf
    
  2. Измените, чтобы включить:

    [daemon]
    AutomaticLoginEnable=true
    AutomaticLogin=your_username
    WaylandEnable=false
    
  3. Перезапустите GDM3:

    sudo systemctl restart gdm3
    

Шаг 3. Настройка X11

Выполните следующие действия, чтобы настроить X11.

  1. Получите идентификатор шины GPU:

    lspci -d 1002: | awk '{print $1}'
    
  2. Преобразуйте идентификатор шестнадцатеричной шины в десятичный формат. Например, 3a9e:00:00.0 преобразуется в 3841536.

  3. Изменение файла /usr/share/X11/xorg.conf.d/00-amdgpu.confконфигурации X:

    Section "Device"
        Identifier "Card0"
        Driver "amdgpu"
        BusID "PCI:3841536:0:0"
    EndSection
    
    Section "Screen"
        Identifier "Screen0"
        Device "Card0"
        Monitor "Monitor0"
    EndSection
    
  4. Отредактируйте файл /usr/share/X11/xorg.conf.d/10-amdgpu.conf:

    Section "OutputClass"
        Identifier "Card0"
        MatchDriver "amdgpu"
        Driver "amdgpu"
        Option "PrimaryGPU" "yes"
    EndSection
    
  5. Перезагрузите и загрузите драйвер:

    sudo reboot
    
  6. После перезагрузки выполните следующие команды:

    sudo systemctl stop gdm
    sudo modprobe amdgpu
    sudo systemctl start gdm
    

Шаг 4. Запуск сервера VNC

Чтобы запустить сервер, выполните следующую команду.

x11vnc --forever -find

Примечание.

Конфигурация X11 работает только с образами Ubuntu Desktop, а не с образами сервера.


Устранение неполадок

Понижение до версии ядра 6.8

Чтобы обеспечить совместимость, можно перейти на версию 6.8, выполнив следующие действия.

  1. Проверьте загруженные ядра:

    dpkg --list | egrep -i --color 'linux-image|linux-headers|linux-modules' | awk '{ print $2 }'
    
  2. Установите ядро 6.8:

    sudo apt install linux-image-6.8.0-1025-azure
    
  3. Редактировать GRUB

    sudo vim /etc/default/grub
    
  4. Задайте для ядра 6.8 значение по умолчанию:

    GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.8.0-1025-azure"
    
  5. Обновите GRUB и перезагрузите:

    sudo update-grub
    sudo reboot
    
  6. Проверьте версию ядра:

    uname -a
    
  7. Удалите ссылки на ядро 6.17:

    sudo apt purge linux-headers-6.17.0-1011-azure linux-image-6.17.0-1011-azure linux-modules-6.17.0-1011-azure linux-modules-extra-6.17.0-1011-azure
    

Удаление драйвера GPU AMD

Чтобы полностью удалить драйвер GPU AMD, выполните следующие команды:

dkms status
sudo amdgpu-install --uninstall
sudo amdgpu-uninstall
sudo apt autoremove --purge amdgpu-install
sudo reboot

Проверьте удаление:

dkms status