Поделиться через


Расширение драйвера GPU AMD для Linux

Это расширение устанавливает драйверы GPU AMD на виртуальных машинах серии N под управлением Linux. При установке драйверов AMD с помощью этого расширения требуется принять условия лицензионного соглашения AMD . Во время установки драйвера виртуальная машина может быть перезагружена для завершения процедуры.

Доступны инструкции по установке драйверов вручную и сведения о поддерживаемых сейчас версиях. Расширение также доступно для установки драйверов GPU AMD на виртуальных машинах серии N Linux.

Замечание

При включенной безопасной загрузке все компоненты загрузки ОС, включая загрузчик, ядро и драйверы ядра, должны быть подписаны доверенными издателями, ключи которых признаются системой. Дополнительные сведения об установке драйверов GPU с поддержкой безопасной загрузки вручную см. в статье о настройке драйвера GPU серии N в Azure для Linux.

Расширения драйверов GPU не обновляют драйвер автоматически после установки расширения. Чтобы выполнить обновление до более новой версии драйвера, необходимо либо удалить и переустановить расширение, либо вручную установить драйвер.

Замечание

Новое! Попробуйте использовать поддержку виртуальной машины для ускорения диагностикиРекомендуется запустить VM Assist для Windows или VM Assist для Linux. Эти средства диагностики на основе скриптов помогают выявить распространенные проблемы, влияющие на гостевой агент виртуальной машины Azure и общую работоспособность виртуальных машин.

Предпосылки

Операционная система

Это расширение поддерживает указанные ниже дистрибутивы, в зависимости от поддержки драйвера в конкретной версии ОС.

Распределение Версия
Linux: Ubuntu 22.04
24.04

Замечание

Инструкции по установке других дистрибутивов Linux см. в документации AMD

Подключение к Интернету

Расширение драйверов GPU AMD требует, чтобы целевая виртуальная машина была подключена к Интернету и имеет доступ.

Просмотрите схему расширения

В следующем фрагменте JSON показана схема расширения:

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "AmdGpuDriverLinux",
    "typeHandlerVersion": "1.0",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Свойства

Схема JSON содержит значения для следующих параметров.

Имя Значение или пример Тип данных
apiVersion 15.06.2015 дата
издатель Microsoft.HpcCompute струна
тип AmdGpuDriverLinux струна
версияТипаОбработчика 1.0 инт

Настройки

Все эти параметры не являются обязательными. Поведение по умолчанию заключается в том, чтобы не обновлять ядро, если не требуется для установки драйвера и устанавливать последний поддерживаемый драйвер.

Имя Значение по умолчанию Допустимые значения Тип данных
Версия драйвера Последнее Список поддерживаемых версий драйверов струна

Развертывание расширения

Расширения виртуальных машин Azure можно управлять с помощью шаблонов Azure CLI, PowerShell, Azure Resource Manager (ARM) и портал Azure.

Портал Azure

Чтобы установить расширение виртуальной машины AZURE AMD на портале Azure, выполните следующие действия.

  1. В портале Azure перейдите на виртуальную машину, на которую вы хотите установить расширение.

  2. В разделе "Параметры" выберите "Расширения и приложения".

    Снимок экрана, показывающий, как выбрать расширения и приложения для виртуальной машины в портале Azure.

  3. В разделе "Расширения" нажмите кнопку "+ Добавить".

    Снимок экрана: добавление расширения виртуальной машины для выбранной виртуальной машины на портале Azure.

  4. Прокрутите экран, найдите и выберите расширение драйвера GPU AMD, а затем нажмите кнопку Далее.

    Снимок экрана: выбор расширения драйвера GPU AMD.

  5. Выберите Просмотр и создание, а затем нажмите Создать.

    Подождите несколько минут, пока завершится развертывание драйвера.

    Снимок экрана, на котором показано, как выбрать кнопку

  6. Убедитесь, что расширение указано как установленное расширение для виртуальной машины.

    Снимок экрана, на котором показано новое расширение в списке расширений для ВМ.

Шаблон Azure Resource Manager

Вы можете использовать шаблоны Azure Resource Manager для развертывания расширений виртуальной машины Azure. Шаблоны идеально подходят для развертывания одной или нескольких виртуальных машин, требующих настройки после развертывания.

Конфигурацию JSON для расширения виртуальной машины можно вложить в ресурс виртуальной машины либо поместить в корневой (верхний) уровень JSON-файла шаблона Resource Manager. Размещение конфигурации JSON влияет на значения имени и типа ресурса. Дополнительные сведения см. в разделе Указание имени и типа дочернего ресурса в шаблоне Resource Manager.

В следующем примере предполагается, что расширение встроено в ресурс виртуальной машины. Когда ресурс расширения является вложенным, JSON-код помещается в объект виртуальной машины "resources": [].

{
  "name": "myExtensionName",
  "type": "extensions",
  "location": "[resourceGroup().location]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', myVM)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "AmdGpuDriverLinux",
    "typeHandlerVersion": "1.0",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Set-AzVMExtension
    -ResourceGroupName "myResourceGroup" `
    -VMName "myVM" `
    -Location "southcentralus" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "AmdGpuDriverLinux" `
    -ExtensionType "AmdGpuDriverLinux" `
    -TypeHandlerVersion 1.0 `
    -SettingString '{}'

Azure CLI (Интерфейс командной строки для Azure)

Представленный ниже пример в точности соответствует предыдущим примерам для Azure Resource Manager и PowerShell.

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name AmdGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.0

Также этот пример добавляет два необязательных настраиваемых параметра, чтобы продемонстрировать установку драйвера в конфигурации, отличной от конфигурации по умолчанию.

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name AmdGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.0 \
  --settings '{ \
    "driverVersion": "6.3.3" \
  }'

Устранение неполадок

Проверка состояния расширения

Проверьте состояние развертывания расширения в портал Azure или с помощью PowerShell или Azure CLI.

Чтобы просмотреть состояние развертывания расширений для данной виртуальной машины, выполните следующие команды:

Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table

Просмотр журналов выходных данных

Просмотр выходных журналов развертывания расширения виртуальной машины Azure AMD. Для отслеживания состояния любой долгой установки и устранения сбоев обратитесь к этому файлу.

/var/log/azure/amd-vmext-status

Реагирование на коды выхода

В следующей таблице перечислены распространенные коды выхода для развертывания и потенциальных дальнейших действий.

Код выхода Значение Возможное действие
0 Операция выполнена успешно Никаких обязательных действий.
1 Неправильное использование расширения Проверьте журнал выходных данных выполнения.
2 Python не найден Проверьте журнал выходных данных выполнения.
10 Службы Integration Services в Linux для Hyper-V и Azure недоступны или не установлены Проверьте выходные данные lspci.
11 Gpu AMD не найден в этом размере виртуальной машины Используйте поддерживаемый размер виртуальной машины и ОС..
14 Интерфейс DPKG (/var/lib/dpkg/lock-frontend) заблокирован другим процессом Попробуйте переустановить через некоторое время.
15 DPKG (/var/lib/dpkg/lock) заблокирован другим процессом Попробуйте переустановить через некоторое время.
17 Не удалось скачать драйвер Проверьте журнал выходных данных выполнения.
18 Не удалось скачать драйвер Проверьте журнал выходных данных выполнения.
19 Не удалось установить драйвер Проверьте журнал выходных данных выполнения.
20 Недостаточно места на диске Проверьте журнал выходных данных выполнения.
двадцать один Несовместимое ядро Проверьте допустимость ядра здесь AMD-GPU-Linux-Resources.
двадцать два Сбой проверки совместимости Проверьте допустимость ядра здесь AMD-GPU-Linux-Resources.
двадцать три Обязательные переменные не заданы Проверьте журнал выходных данных выполнения.

Дальнейшие шаги