Rozšíření ovladače NVIDIA GPU pro Linux

Upozornění

Tento článek odkazuje na CentOS, linuxovou distribuci, která se blíží stavu Konec životnosti (EOL). Zvažte své použití a odpovídajícím způsobem naplánujte. Další informace najdete v doprovodných materiálech CentOS End Of Life.

Toto rozšíření nainstaluje ovladače NVIDIA GPU na virtuální počítače řady N-series s Linuxem. V závislosti na rodině virtuálních počítačů rozšíření nainstaluje ovladače CUDA nebo GRID. Při instalaci ovladačů NVIDIA pomocí tohoto rozšíření přijímáte a souhlasíte s podmínkami licenční smlouvy s koncovým uživatelem NVIDIA. Během procesu instalace se může virtuální počítač restartovat, aby se dokončil instalační program ovladače.

K dispozici jsou pokyny k ruční instalaci ovladačů a aktuálních podporovaných verzí. K dispozici je také rozšíření pro instalaci ovladačů NVIDIA GPU na virtuální počítače řady Windows N-series.

Poznámka:

Pokud je zapnuté zabezpečené spouštění, musí být všechny spouštěcí komponenty operačního systému (zavaděč spouštění, jádro, ovladače jádra) podepsané důvěryhodnými vydavateli (klíč, kterému systém důvěřuje). Zabezpečené spouštění není podporováno pomocí rozšíření pro Windows nebo Linux. Další informace o ruční instalaci ovladačů GPU s povoleným zabezpečeným spouštěním najdete v tématu Nastavení ovladače GPU řady N-series pro Linux.

Poznámka:

Rozšíření ovladačů GPU po instalaci rozšíření automaticky neaktualizují ovladač. Pokud potřebujete přejít na novější verzi ovladače, stáhněte a nainstalujte ovladač ručně nebo ho odeberte a znovu přidejte.

Požadavky

Operační systém

Toto rozšíření podporuje následující distribuce operačního systému v závislosti na podpoře ovladačů pro konkrétní verzi operačního systému:

Distribuce Verze
Linux Ubuntu: 20.04 LTS
Linux: Red Hat Enterprise Linux 7.9
Linux: CentOS 7

Poznámka:

Nejnovější podporované ovladače CUDA pro virtuální počítače řady NC jsou aktuálně 470.82.01. Novější verze ovladačů nejsou na kartách K80 v síťovém adaptéru podporované. Zatímco se rozšíření aktualizuje tímto koncem podpory pro nc, nainstalujte ovladače CUDA ručně pro karty K80 na nc-series.

Důležité

Tento dokument odkazuje na verzi Linuxu, která se blíží nebo na konci životnosti (EOL). Zvažte aktualizaci na aktuálnější verzi.

Připojení k internetu

Rozšíření Microsoft Azure pro ovladače NVIDIA GPU vyžaduje, aby cílový virtuální počítač byl připojený k internetu a má přístup.

Schéma rozšíření

Následující JSON ukazuje schéma rozšíření:

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverLinux",
    "typeHandlerVersion": "1.6",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Vlastnosti

Název Hodnota/příklad Datový typ
apiVersion 2015-06-15 datum
Vydavatel Microsoft.HpcCompute string
type NvidiaGpuDriverLinux string
typeHandlerVersion 1.6 int

Nastavení

Všechna nastavení jsou volitelná. Výchozí chování je neaktualizovat jádro, pokud není nutné pro instalaci ovladače a nainstalovat nejnovější podporovaný ovladač a sadu nástrojů CUDA (podle potřeby).

Název Popis Default value Platné hodnoty Datový typ
updateOS Aktualizujte jádro i v případě, že není vyžadováno pro instalaci ovladače. false (nepravda) true, false boolean
driverVersion NV: Verze ovladače GRID.
NC/ND: Verze sady nástrojů CUDA. Automaticky se nainstalují nejnovější ovladače pro zvolenou CUDA.
nejnovější Seznam podporovaných verzí ovladačů string
installCUDA Nainstalujte sadu nástrojů CUDA. Relevantní pouze pro virtuální počítače řady NC/ND. true true, false boolean

Nasazení

portál Azure

Rozšíření virtuálních počítačů Azure NVIDIA můžete nasadit na webu Azure Portal.

  1. Přejděte v prohlížeči na Portál Azure.

  2. Přejděte na virtuální počítač, na který chcete ovladač nainstalovat.

  3. V nabídce vlevo vyberte Rozšíření.

    Snímek obrazovky znázorňující výběr rozšíření v nabídce webu Azure Portal

  4. Vyberte Přidat.

    Snímek obrazovky znázorňující přidání rozšíření V M pro vybraný virtuální počítač

  5. Posuňte se, vyhledejte a vyberte rozšíření ovladače NVIDIA GPU a pak vyberte Další.

    Snímek obrazovky znázorňující výběr rozšíření ovladače NVIDIA G P U

  6. Vyberte Zkontrolovat a vytvořit a vyberte Vytvořit. Počkejte několik minut, než se ovladač nasadí.

    Snímek obrazovky znázorňující výběr tlačítka Zkontrolovat a vytvořit

  7. Ověřte, že se rozšíření přidalo do seznamu nainstalovaných rozšíření.

    Snímek obrazovky znázorňující nové rozšíření v seznamu rozšíření virtuálního počítače

Šablona Azure Resource Manageru

K nasazení rozšíření virtuálních počítačů Azure můžete použít šablony Azure Resource Manageru. Šablony jsou ideální, když nasadíte jeden nebo více virtuálních počítačů, které vyžadují konfiguraci po nasazení.

Konfiguraci JSON pro rozšíření virtuálního počítače je možné vnořit do prostředku virtuálního počítače nebo umístit na kořenovou nebo nejvyšší úroveň šablony JSON Resource Manageru. Umístění konfigurace JSON má vliv na hodnotu názvu a typu prostředku. Další informace naleznete v tématu Nastavení názvu a typu pro podřízené prostředky.

Následující příklad předpokládá, že rozšíření je vnořené uvnitř prostředku virtuálního počítače. Když je prostředek rozšíření vnořený, json se umístí do "resources": [] objektu virtuálního počítače.

{
  "name": "myExtensionName",
  "type": "extensions",
  "location": "[resourceGroup().location]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', myVM)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverLinux",
    "typeHandlerVersion": "1.6",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Set-AzVMExtension
    -ResourceGroupName "myResourceGroup" `
    -VMName "myVM" `
    -Location "southcentralus" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "NvidiaGpuDriverLinux" `
    -ExtensionType "NvidiaGpuDriverLinux" `
    -TypeHandlerVersion 1.6 `
    -SettingString '{ `
	}'

Azure CLI

Následující příklad zrcadlí předchozí příklady Resource Manageru a PowerShellu:

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name NvidiaGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.6

Následující příklad také přidá dvě volitelná vlastní nastavení jako příklad pro nedefault instalaci ovladače. Konkrétně aktualizuje jádro operačního systému na nejnovější verzi a nainstaluje konkrétní ovladač verze sady nástrojů CUDA. Znovu si všimněte, že --settings jsou volitelné a výchozí. Aktualizace jádra může zvýšit dobu instalace rozšíření. Také volba konkrétní (starší) verze sady nástrojů CUDA nemusí být vždy kompatibilní s novějšími jádry.

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name NvidiaGpuDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.6 \
  --settings '{ \
    "updateOS": true, \
    "driverVersion": "10.0.130" \
  }'

Řešení potíží a podpora

Odstraňování potíží

Data o stavu nasazení rozšíření můžete načíst z webu Azure Portal a pomocí Azure PowerShellu a Azure CLI. Pokud chcete zobrazit stav nasazení rozšíření pro daný virtuální počítač, spusťte následující příkaz:

Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table

Výstup spuštění rozšíření se protokoluje do následujícího souboru. Informace o stavu jakékoli dlouhotrvající instalace a řešení potíží se selháními najdete v tomto souboru.

/var/log/azure/nvidia-vmext-status

Ukončovací kódy

Ukončovací kód Význam Možná akce
0 Operace byla úspěšná.
0 Nesprávné použití rozšíření Zkontrolujte výstupní protokol spuštění.
10 Integrační služby pro Linux pro Hyper-V a Azure nejsou dostupné nebo nainstalované Zkontrolujte výstup lspci.
11 U této velikosti virtuálního počítače se nenašel GRAFICKÝ PROCESOR NVIDIA Použijte podporovanou velikost virtuálního počítače a operační systém.
12 Nabídka obrázků není podporovaná
13 Nepodporovaná velikost virtuálního počítače K nasazení použijte virtuální počítač řady N-series.
14 Neúspěšná operace Zkontrolujte výstupní protokol spuštění.

Technická podpora

Pokud potřebujete další pomoc v libovolném okamžiku v tomto článku, obraťte se na odborníky na Azure na fórech MSDN Azure a Stack Overflow. Případně můžete podat incident podpora Azure. Přejděte na podpora Azure a vyberte Získat podporu. Informace o používání podpora Azure najdete v podpora Azure nejčastějších dotazech.

Další kroky