Udostępnij za pośrednictwem


Rozszerzenie sterownika procesora GPU firmy AMD dla systemu Linux

To rozszerzenie instaluje sterowniki procesorów GPU FIRMY AMD na maszynach wirtualnych serii N systemu Linux. Podczas instalowania sterowników FIRMY AMD przy użyciu tego rozszerzenia akceptujesz i wyrażasz zgodę na warunki umowy licencyjnej FIRMY AMD End-User. Podczas procesu instalacji maszyna wirtualna może zostać ponownie uruchomiona, aby ukończyć konfigurację sterownika.

Dostępne są instrukcje dotyczące ręcznej instalacji sterowników i bieżących obsługiwanych wersji. Rozszerzenie jest również dostępne do instalowania sterowników procesora GPU AMD na maszynach wirtualnych serii N z systemem Linux.

Uwaga / Notatka

Po włączeniu bezpiecznego rozruchu wszystkie składniki rozruchu systemu operacyjnego, w tym moduł ładujący rozruch, jądro i sterowniki jądra, muszą być podpisane przez zaufanych wydawców, których klucze są zaufane przez system. Aby uzyskać więcej informacji na temat ręcznego instalowania sterowników procesora GPU z włączonym bezpiecznym rozruchem, zobacz Konfiguracja sterownika procesora GPU serii N platformy Azure dla systemu Linux.

Rozszerzenia sterowników procesora GPU nie aktualizują automatycznie sterownika po zainstalowaniu rozszerzenia. Aby uaktualnić do nowszej wersji sterownika, należy odinstalować i ponownie zainstalować rozszerzenie lub ręcznie zainstalować sterownik.

Wymagania wstępne

System operacyjny

To rozszerzenie obsługuje następujące dystrybucje systemu operacyjnego, w zależności od obsługi sterowników dla określonej wersji systemu operacyjnego:

Dystrybucja wersja
Linux: Ubuntu 22.04
24.04

Uwaga / Notatka

Instrukcje dotyczące instalacji w innych dystrybucjach systemu Linux można znaleźć w dokumentacji firmy AMD

Łączność z Internetem

Rozszerzenie sterowników procesorów GPU firmy AMD wymaga, aby docelowa maszyna wirtualna została połączona z Internetem i ma dostęp.

Przeglądanie schematu rozszerzenia

Poniższy fragment kodu JSON przedstawia schemat rozszerzenia:

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "AmdGpuDriverLinux",
    "typeHandlerVersion": "1.0",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Właściwości

Schemat JSON zawiera wartości dla następujących parametrów.

Nazwa Wartość/przykład Typ danych
apiVersion 2015-06-15 termin
wydawca Microsoft.HpcCompute sznurek
rodzaj AmdGpuDriverLinux sznurek
wersjaTypeHandlera 1.0 int (integer)

Ustawienia

Wszystkie ustawienia są opcjonalne. Domyślne zachowanie polega na tym, aby nie aktualizować jądra, jeśli nie jest wymagane w przypadku instalacji sterownika i zainstalować najnowszy obsługiwany sterownik.

Nazwa Wartość domyślna Prawidłowe wartości Typ danych
wersja sterownika Najnowsze Lista obsługiwanych wersji sterowników sznurek

Wdrażanie rozszerzenia

Rozszerzenia maszyn wirtualnych platformy Azure można zarządzać przy użyciu interfejsu wiersza polecenia platformy Azure, programu PowerShell, szablonów usługi Azure Resource Manager (ARM) i witryny Azure Portal.

Portal Azure

Aby zainstalować rozszerzenie maszyny wirtualnej azure AMD w witrynie Azure Portal, wykonaj następujące kroki:

  1. W witrynie Azure Portal przejdź do maszyny wirtualnej, na której chcesz zainstalować rozszerzenie.

  2. W obszarze Ustawienia wybierz pozycję Rozszerzenia i aplikacje.

    Zrzut ekranu przedstawiający sposób wybierania pozycji Rozszerzenia i aplikacje dla maszyny wirtualnej w witrynie Azure Portal.

  3. W obszarze Rozszerzenia wybierz pozycję + Dodaj.

    Zrzut ekranu przedstawiający dodawanie rozszerzenia maszyny wirtualnej dla wybranej maszyny wirtualnej w witrynie Azure Portal.

  4. Przewiń, aby znaleźć i wybrać rozszerzenie sterownika procesora GPU firmy AMD, a następnie wybierz przycisk Dalej.

    Zrzut ekranu przedstawiający wybieranie rozszerzenia sterownika procesora GPU firmy AMD.

  5. Wybierz Przejrzyj i utwórz, a następnie Utwórz.

    Poczekaj kilka minut na zainstalowanie sterownika.

    Zrzut ekranu przedstawiający wybieranie przycisku Przejrzyj + utwórz.

  6. Upewnij się, że rozszerzenie jest wyświetlane jako zainstalowane rozszerzenie dla maszyny wirtualnej.

    Zrzut ekranu przedstawiający nowe rozszerzenie na liście rozszerzeń dla V M.

Szablon usługi Azure Resource Manager

Szablony usługi Azure Resource Manager umożliwiają wdrażanie rozszerzeń maszyn wirtualnych platformy Azure. Szablony są idealne podczas wdrażania co najmniej jednej maszyny wirtualnej wymagającej konfiguracji po wdrożeniu.

Konfiguracja JSON rozszerzenia maszyny wirtualnej może być zagnieżdżona wewnątrz zasobu maszyny wirtualnej lub umieszczona na poziomie głównym lub najwyższym szablonu JSON usługi Resource Manager. Umieszczanie konfiguracji JSON wpływa na wartość nazwy i typu zasobu. Aby uzyskać więcej informacji, przejdź do Ustaw nazwę i typ zasobów podrzędnych.

W poniższym przykładzie założono, że rozszerzenie jest zagnieżdżone wewnątrz zasobu maszyny wirtualnej. Gdy zasób rozszerzenia jest zagnieżdżony, kod JSON umieszczany jest w obiekcie "resources": [] maszyny wirtualnej.

{
  "name": "myExtensionName",
  "type": "extensions",
  "location": "[resourceGroup().location]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', myVM)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "AmdGpuDriverLinux",
    "typeHandlerVersion": "1.0",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Set-AzVMExtension
    -ResourceGroupName "myResourceGroup" `
    -VMName "myVM" `
    -Location "southcentralus" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "AmdGpuDriverLinux" `
    -ExtensionType "AmdGpuDriverLinux" `
    -TypeHandlerVersion 1.0 `
    -SettingString '{}'

CLI Azure

Poniższy przykład odzwierciedla powyższe przykłady usługi Resource Manager i programu PowerShell:

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name AmdGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.0

W poniższym przykładzie dodano również dwa opcjonalne ustawienia niestandardowe jako przykład instalacji niezdefaultowego sterownika.

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name AmdGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.0 \
  --settings '{ \
    "driverVersion": "6.3.3" \
  }'

Rozwiązywanie problemów

Sprawdzanie stanu rozszerzenia

Sprawdź stan wdrożenia rozszerzenia w witrynie Azure Portal lub przy użyciu programu PowerShell lub interfejsu wiersza polecenia platformy Azure.

Aby wyświetlić stan wdrożenia rozszerzeń dla danej maszyny wirtualnej, uruchom następujące polecenia:

Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table

Przeglądanie dzienników wyjściowych

Zobacz dzienniki wyjściowe wdrożenia rozszerzenia maszyny wirtualnej AMD platformy Azure. Zapoznaj się z tym plikiem, aby śledzić stan każdej długotrwałej instalacji i rozwiązać problemy z błędami.

/var/log/azure/amd-vmext-status

Reaguj na kody zakończenia

Poniższa tabela zawiera listę typowych kodów zakończenia wdrożenia i potencjalnych działań następczych.

Kod zakończenia Znaczenie Możliwe działanie
0 Operacja powiodła się Brak wymaganej akcji.
1 Nieprawidłowe użycie rozszerzenia Sprawdź dziennik wyników wykonywania.
2 Nie znaleziono języka Python Sprawdź dziennik wyników wykonywania.
10 Usługi integracji z systemem Linux dla Hyper-V i Azure nie są dostępne ani zainstalowane Sprawdź dane wyjściowe lspci.
11 Nie można odnaleźć procesora GPU firmy AMD w tym rozmiarze maszyny wirtualnej Użyj obsługiwanego rozmiaru maszyny wirtualnej i systemu operacyjnego.
14 Fronton DPKG (/var/lib/dpkg/lock-frontend) jest zablokowany przez inny proces Spróbuj ponownie zainstalować po pewnym czasie.
15 Program DPKG (/var/lib/dpkg/lock) jest zablokowany przez inny proces Spróbuj ponownie zainstalować po pewnym czasie.
17 Nie można pobrać sterownika Sprawdź dziennik wyników wykonywania.
18 Nie można pobrać sterownika Sprawdź dziennik wyników wykonywania.
19 Nie można zainstalować sterownika Sprawdź dziennik wyników wykonywania.
20 Za mało miejsca na dysku Sprawdź dziennik wyników wykonywania.
dwadzieścia jeden Niezgodne jądro Sprawdź ważność jądra tutaj AMD-GPU-Linux-Resources.
22 Sprawdzanie zgodności nie powiodło się Sprawdź ważność jądra tutaj AMD-GPU-Linux-Resources.
23 Wymagana zmienna nie jest ustawiona Sprawdź dziennik wyników wykonywania.

Dalsze kroki