Virtuální počítač s grafickým procesorem (GPU) ve službě Azure Stack Hub
Tento článek popisuje, které modely grafických procesorů (GPU) jsou podporovány v integrovaném systému Služby Azure Stack Hub. Článek obsahuje také pokyny k instalaci ovladačů použitých s grafickými procesory. Podpora GPU ve službě Azure Stack Hub umožňuje řešení, jako je umělá inteligence, trénování, odvozování a vizualizace dat. AMD Xiaomi Instinct MI25 lze použít k podpoře grafických aplikací náročných na grafiku, jako je Autodesk AutoCAD.
Můžete si vybrat ze tří modelů GPU. Jsou dostupné v GPU NVIDIA V100, NVIDIA T4 a AMD MI25. Tyto fyzické GPU odpovídají následujícím typům virtuálních počítačů řady Azure N-Series:
Upozorňující
V této verzi se virtuální počítače GPU nepodporují. Musíte upgradovat na Azure Stack Hub 2005 nebo novější. Kromě toho váš hardware služby Azure Stack Hub musí obsahovat fyzické GPU.
NCv3
Virtuální počítače řady NCv3 využívají GPU NVIDIA Tesla V100. Zákazníci můžou využít tyto aktualizované gpu pro tradiční úlohy PROSTŘEDÍ HPC, jako je modelování nádrží, sekvencování DNA, analýza bílkovin, simulace Monte Carlo a další.
Velikost | Virtuální procesory | Paměť: GiB | Dočasné úložiště (SSD): GiB | GPU | Paměť GPU: GiB | Max. datových disků | Maximální počet síťových karet |
---|---|---|---|---|---|---|---|
Standard_NC6s_v3 | 6 | 112 | 736 | 0 | 16 | 12 | 4 |
Standard_NC12s_v3 | 12 | 224 | 1474 | 2 | 32 | 24 | 8 |
Standard_NC24s_v3 | 24 | 448 | 2948 | 4 | 64 | 32 | 8 |
NVv4
Virtuální počítače řady NVv4 jsou vybaveny procesory AMD Amd Amd Instinct MI25 GPU. S řadou NVv4 zavádí Azure Stack Hub virtuální počítače s částečnými grafickými procesory. Tuto velikost lze použít pro akcelerované grafické aplikace GPU a virtuální plochy. Virtuální počítače NVv4 aktuálně podporují pouze hostovaný operační systém Windows.
Velikost | Virtuální procesory | Paměť: GiB | Dočasné úložiště (SSD): GiB | GPU | Paměť GPU: GiB | Max. datových disků | Maximální počet síťových karet |
---|---|---|---|---|---|---|---|
Standard_NV4as_v4 | 4 | 14 | 88 | 1/8 | 2 | 4 | 2 |
Standard_NV8as_v4 | 8 | 28 | 176 | 1/4 | 4 | 8 | 4 |
Standard_NV16as_v4 | 16 | 56 | 352 | 1/2 | 8 | 16 | 8 |
Standard_NV32as_v4 | 32 | 112 | 704 | 0 | 16 | 32 | 8 |
NCasT4_v3
Velikost | Virtuální procesory | Paměť: GiB | GPU | Paměť GPU: GiB | Max. datových disků | Maximální počet síťových karet |
---|---|---|---|---|---|---|
Standard_NC4as_T4_v3 | 4 | 28 | 0 | 16 | 8 | 4 |
Standard_NC8as_T4_v3 | 8 | 56 | 0 | 16 | 16 | 8 |
Standard_NC16as_T4_v3 | 16 | 110 | 0 | 16 | 32 | 8 |
Standard_NC64as_T4_v3 | 64 | 440 | 4 | 64 | 32 | 8 |
NC_A100 v4
Virtuální počítače řady NC_A100 jsou vybaveny grafickými procesory NVIDIA Ampere A100, které jsou následníkem GPU Tesla V100. Tyto aktualizované GPU můžete využít pro tradiční úlohy PROSTŘEDÍ HPC, jako je modelování nádrží, sekvencování DNA, analýza bílkovin, simulace Monte Carlo a další.
Velikost | Virtuální procesory | Paměť: GiB | Dočasné úložiště (GiB) | Max. datových disků | GPU | GiB paměti GPU | Maximální počet síťových karet |
---|---|---|---|---|---|---|---|
Standard_NC24ads_A100_v4 | 24 | 220 | 1123 | 12 | 0 | 80 | 2 |
Standard_NC48ads_A100_v4 | 48 | 440 | 2246 | 24 | 2 | 160 | 4 |
NC_L40S v4
Velikost | Virtuální procesory | Paměť: GiB | Dočasné úložiště (GiB) | Max. datových disků | GPU | GiB paměti GPU | Maximální počet síťových karet |
---|---|---|---|---|---|---|---|
Standard_NC24ads_L40S_v4 | 24 | 220 | 1123 | 8 | 0 | 80 | 2 |
Standard_NC48ads_L40S_v4 | 48 | 440 | 2246 | 16 | 2 | 160 | 4 |
Důležité informace o systému GPU
- GPU musí být jedním z těchto SKU: AMD MI-25, Nvidia V100 (a varianty), Nvidia T4.
- Počet gpu na server podporovaných (1, 2, 3, 4) Upřednostňované jsou: 1, 2 a 4.
- Všechny GPU musí být v celé jednotce škálování úplně stejné skladové položky.
- Všechna množství GPU na server musí být stejná v celé jednotce škálování.
- Velikost oddílů GPU (pro AMD Mi25) musí být stejná ve všech virtuálních počítačích GPU ve škálovací jednotce.
Plánování kapacity
Plánovač kapacity služby Azure Stack Hub byl aktualizován tak, aby podporoval konfigurace GPU. Je přístupná tady.
Přidání GPU do existující služby Azure Stack Hub
Azure Stack Hub teď podporuje přidání GPU do libovolného existujícího systému. Pokud chcete přidat GPU, spusťte , projděte stop-azurestack
si postup stop-azurestack
, přidejte GPU a pak spusťte start-azurestack
až do dokončení. Pokud už systém obsahuje GPU, musí být stop-deallocated
a restartovat všechny dříve vytvořené virtuální počítače GPU.
Oprava a aktualizace, chování FRU virtuálních počítačů
Virtuální počítače s GPU procházejí výpadky během operací, jako jsou oprava a aktualizace (PnU) a výměna hardwaru (FRU) služby Azure Stack Hub. Následující tabulka popisuje stav virtuálního počítače, jak je pozorováno během těchto aktivit, a ruční akci, kterou můžete udělat, abyste tyto virtuální počítače po operaci zpřístupnily.
Operace | PnU – úplná aktualizace, aktualizace OEM | FRU |
---|---|---|
Stav virtuálního počítače | Během aktualizace není k dispozici. Dá se zpřístupnit s ručním provozem. Virtuální počítač je po aktualizaci automaticky online. | Během FRU není k dispozici. Dá se zpřístupnit s ručním provozem. Po FRU je potřeba virtuální počítač převést zpět. |
Ruční operace | Pokud je potřeba virtuální počítač zpřístupnit během aktualizace, pokud jsou k dispozici oddíly GPU, můžete virtuální počítač restartovat z portálu kliknutím na tlačítko Restartovat . Virtuální počítač se po aktualizaci automaticky zálohuje. | Virtuální počítač není během FRU dostupný. Pokud jsou k dispozici gpu, virtuální počítač se může zastavit a restartovat během FRU. Po dokončení FRU musí stop-deallocated virtuální počítač používat tlačítko Zastavit a pak restartovat pomocí tlačítka Start . |
Instalace ovladače hosta
Pro instalaci ovladače je možné použít následující rutiny PowerShellu:
$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"
Set-AzureRmVMExtension -Location $Location `
-Publisher $driverPublisher `
-ExtensionType $driverType `
-TypeHandlerVersion $driverVersion `
-VMName $VmName `
-ResourceGroupName $ResourceGroupName `
-Name $driverName `
-Settings $Settings ` # If no settings are set, omit this parameter
-Verbose
V závislosti na operačním systému musíte tyto hodnoty nahradit nastavením níže.
AMD MI25
Verze ovladače hosta se musí shodovat s verzí služby Azure Stack Hub bez ohledu na stav připojení. Použití novějších verzí, které nejsou v souladu s verzí služby Azure Stack Hub, může způsobit problémy s použitelností.
Verze služby Azure Stack Hub | Ovladač hosta AMD |
---|---|
2206 a novější | 21.Q2-1, 20.Q4-1 |
2108 | 21.Q2-1, 20.Q4-1 |
2102 | 21.Q2-1, 20.Q4-1 |
Připojeno
Použijte skript PowerShellu v předchozí části s odpovídajícím typem ovladače pro AMD. Článek Instalace ovladačů AMD GPU na virtuální počítače řady N-series s Windows obsahuje pokyny k instalaci ovladače pro AMD Amd Instinct MI25 uvnitř virtuálního počítače s podporou NVv4 GPU-P a postup ověření instalace ovladače.
Odpojeno
Vzhledem k tomu, že rozšíření načítá ovladač z umístění na internetu, virtuální počítač, který je odpojený od externí sítě, k němu nemá přístup. Ovladač si můžete stáhnout z předchozí tabulky a nahrát ho do účtu úložiště v místní síti, která je pro virtuální počítač přístupná.
Přidejte ovladač AMD do účtu úložiště a zadejte adresu URL pro tento účet v Settings
souboru . Tato nastavení se musí použít v rutině Set-AzureRMVMExtension . Příklad:
$Settings = @{
"DriverURL" = <URL to driver in storage account>
}
NVIDIA
Ovladače NVIDIA musí být nainstalovány uvnitř virtuálního počítače pro úlohy CUDA nebo GRID pomocí GPU.
Případ použití: grafika/vizualizace GRID
Tento scénář vyžaduje použití ovladačů GRID. Ovladače GRID je možné stáhnout prostřednictvím centra aplikací NVIDIA za předpokladu, že máte požadované licence. Ovladače GRID také před použitím ovladačů GRID na virtuálním počítači vyžadují licenční server GRID s příslušnými licencemi GRID.
$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="GRID"
}
Případ použití: compute/CUDA – připojeno
Ovladače CUDA nepotřebují licenční server a nepotřebují upravená nastavení.
Případ použití: compute/CUDA – Odpojeno
Odkazy na ovladače NVIDIA CUDA lze získat pomocí odkazu: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json
Windows:
$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="CUDA"
}
Linux:
U nastavení musíte odkazovat na některé adresy URL:
Adresa URL | Notes |
---|---|
PUBKEY_URL | PUBKEY_URL je veřejný klíč pro úložiště ovladačů Nvidia, nikoli pro virtuální počítač s Linuxem. Slouží k instalaci ovladače pro Ubuntu. |
DRIVER_URL | DRIVER_URL je adresa URL pro stažení informací o úložišti ovladače Nvidia a přidá se do seznamu úložišť virtuálního počítače s Linuxem. |
Přidejte adresy URL do nastavení.
$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}