GPU-bővítmény telepítése az Azure Stack Edge Pro GPU-eszköz virtuális gépeire
A következőkre vonatkozik: Azure Stack Edge Pro – GPUAzure Stack Edge Pro 2Azure Stack Edge Pro R
Ez a cikk azt ismerteti, hogyan telepítheti a GPU-illesztőbővítményt a megfelelő Nvidia-illesztőprogramok telepítéséhez az Azure Stack Edge-eszközön futó GPU-virtuális gépeken. A cikk a GPU-bővítmények Telepítésének lépéseit ismerteti Azure Resource Manager-sablonokkal Windows és Linux rendszerű virtuális gépeken.
Feljegyzés
- Az Azure Portalon gpu-bővítményt telepíthet a virtuális gép létrehozásakor vagy a virtuális gép üzembe helyezése után. A lépésekről és a követelményekről a GPU-beli virtuális gépek üzembe helyezéséről olvashat.
- Ha Windows 2016 VHD-t futtat, a GPU-bővítmény 2205-ös vagy újabb verziójának telepítése előtt engedélyeznie kell a TLS 1.2-t a virtuális gépen belül. Részletes lépésekért tekintse meg az Azure Stack Edge Pro GPU-beli GPU-virtuális gépek GPU-bővítményével kapcsolatos problémák hibaelhárítását.
Előfeltételek
Mielőtt gpu-bővítményt telepít az eszközön futó GPU-virtuális gépekre, győződjön meg arról, hogy:
Hozzáféréssel rendelkezik egy Azure Stack Edge-eszközhöz, amelyen egy vagy több GPU-beli virtuális gépet helyez üzembe. Megtudhatja, hogyan helyezhet üzembe GPU virtuális gépet az eszközön.
Győződjön meg arról, hogy az eszközön a számítási hálózat számára engedélyezett port csatlakozik az internethez, és rendelkezik hozzáféréssel. A GPU-illesztőprogramok az internet-hozzáférésen keresztül töltődnek le.
Íme egy példa, amelyben a 2. port csatlakozik az internethez, és a számítási hálózat engedélyezésére szolgál. Ha a Kubernetes nincs üzembe helyezve a környezetben, kihagyhatja a Kubernetes-csomópont IP-címét és a külső szolgáltatás IP-hozzárendelését.
Töltse le a GPU-bővítménysablonokat és paraméterfájlokat az ügyfélszámítógépre. Bontsa ki egy munkakönyvtárként használt könyvtárba.
Ellenőrizze, hogy az eszköz eléréséhez használt ügyfél továbbra is csatlakozik-e az Azure Resource Managerhez az Azure PowerShellen keresztül. Az Azure Resource Managerrel való kapcsolat 1,5 óránként lejár, vagy ha az Azure Stack Edge-eszköz újraindul. Ha ez történik, a végrehajtott parancsmagok olyan hibaüzeneteket adnak vissza, amelyek már nem csatlakoznak az Azure-hoz. Újra be kell jelentkeznie. Részletes útmutatásért lásd: Csatlakozás az Azure Resource Managerhez az Azure Stack Edge-eszközön.
Paraméterfájl szerkesztése
A virtuális gép operációs rendszerétől függően telepítheti a GPU-bővítményt Windowshoz vagy Linuxhoz.
Ha nvidia GPU-illesztőket szeretne üzembe helyezni egy meglévő virtuális géphez, szerkessze a addGPUExtWindowsVM.parameters.json
paraméterfájlt, majd telepítse a sablont addGPUextensiontoVM.json
.
2205-ös vagy újabb verzió
A fájl addGPUExtWindowsVM.parameters.json
a következő paramétereket használja:
"parameters": {
"vmName": {
"value": "<name of the VM>"
},
"extensionName": {
"value": "<name for the extension. Example: windowsGpu>"
},
"publisher": {
"value": "Microsoft.HpcCompute"
},
"type": {
"value": "NvidiaGpuDriverWindows"
},
"typeHandlerVersion": {
"value": "1.5"
},
"settings": {
"value": {
"DriverURL" : "http://us.download.nvidia.com/tesla/511.65/511.65-data-center-tesla-desktop-winserver-2016-2019-2022-dch-international.exe",
"DriverCertificateUrl" : "https://go.microsoft.com/fwlink/?linkid=871664",
"DriverType":"CUDA"
}
}
}
2205-nél kisebb verziók
A fájl addGPUExtWindowsVM.parameters.json
a következő paramétereket használja:
"parameters": {
"vmName": {
"value": "<name of the VM>"
},
"extensionName": {
"value": "<name for the extension. Example: windowsGpu>"
},
"publisher": {
"value": "Microsoft.HpcCompute"
},
"type": {
"value": "NvidiaGpuDriverWindows"
},
"typeHandlerVersion": {
"value": "1.3"
},
"settings": {
"value": {
"DriverURL" : "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
"DriverCertificateUrl" : "https://go.microsoft.com/fwlink/?linkid=871664",
"DriverType":"CUDA"
}
}
}
Sablon üzembe helyezése
Telepítse a sablont addGPUextensiontoVM.json
a bővítmény meglévő virtuális gépre való telepítéséhez.
Futtassa az alábbi parancsot:
$templateFile = "<Path to addGPUextensiontoVM.json>"
$templateParameterFile = "<Path to addGPUExtWindowsVM.parameters.json>"
RGName = "<Name of your resource group>"
New-AzureRmResourceGroupDeployment -ResourceGroupName $RGName -TemplateFile $templateFile -TemplateParameterFile $templateParameterFile -Name "<Name for your deployment>"
Feljegyzés
A bővítmény üzembe helyezése hosszú ideig futó feladat, és körülbelül 10 percet vesz igénybe.
Íme egy mintakimenet:
PS C:\WINDOWS\system32> "C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json"
C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json
PS C:\WINDOWS\system32> $templateFile = "C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json"
PS C:\WINDOWS\system32> $templateParameterFile = "C:\12-09-2020\ExtensionTemplates\addGPUExtWindowsVM.parameters.json"
PS C:\WINDOWS\system32> $RGName = "myasegpuvm1"
PS C:\WINDOWS\system32> New-AzureRmResourceGroupDeployment -ResourceGroupName $RGName -TemplateFile $templateFile -TemplateParameterFile $templateParameterFile -Name "deployment3"
DeploymentName : deployment3
ResourceGroupName : myasegpuvm1
ProvisioningState : Succeeded
Timestamp : 12/16/2020 12:18:50 AM
Mode : Incremental
TemplateLink :
Parameters :
Name Type Value
=============== ========================= ==========
vmName String VM2
extensionName String windowsgpuext
publisher String Microsoft.HpcCompute
type String NvidiaGpuDriverWindows
typeHandlerVersion String 1.3
settings Object {
"DriverURL": "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
"DriverCertificateUrl": "https://go.microsoft.com/fwlink/?linkid=871664",
"DriverType": "CUDA"
}
Outputs :
DeploymentDebugLogLevel :
PS C:\WINDOWS\system32>
Az üzembe helyezés nyomon követése
Egy adott virtuális gép bővítményeinek üzembehelyezési állapotának ellenőrzéséhez nyisson meg egy másik PowerShell-munkamenetet (futtassa rendszergazdaként), majd futtassa a következő parancsot:
Get-AzureRmVMExtension -ResourceGroupName <Name of resource group> -VMName <Name of VM> -Name <Name of the extension>
Íme egy mintakimenet:
PS C:\WINDOWS\system32> Get-AzureRmVMExtension -ResourceGroupName myasegpuvm1 -VMName VM2 -Name windowsgpuext
ResourceGroupName : myasegpuvm1
VMName : VM2
Name : windowsgpuext
Location : dbelocal
Etag : null
Publisher : Microsoft.HpcCompute
ExtensionType : NvidiaGpuDriverWindows
TypeHandlerVersion : 1.3
Id : /subscriptions/947b3cfd-7a1b-4a90-7cc5-e52caf221332/resourceGroups/myasegpuvm1/providers/Microsoft.Compute/virtualMachines/VM2/extensions/windowsgpuext
PublicSettings : {
"DriverURL": "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
"DriverCertificateUrl": "https://go.microsoft.com/fwlink/?linkid=871664",
"DriverType": "CUDA"
}
ProtectedSettings :
ProvisioningState : Creating
Statuses :
SubStatuses :
AutoUpgradeMinorVersion : True
ForceUpdateTag :
PS C:\WINDOWS\system32>
A bővítményvégrehajtás kimenete a következő fájlba lesz naplózva. A telepítés állapotának nyomon követéséhez tekintse meg ezt a fájlt C:\Packages\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\1.3.0.0\Status
.
A sikeres telepítés megjeleníti a message
with Enable Extension
and of success
status
.
"status": {
"formattedMessage": {
"message": "Enable Extension",
"lang": "en"
},
"name": "NvidiaGpuDriverWindows",
"status": "success",
Illesztőprogram telepítésének ellenőrzése
Jelentkezzen be a virtuális gépre, és futtassa az nvidia-smi parancssori segédprogramot az illesztőprogrammal együtt.
2205-ös vagy újabb verzió
A nvidia-smi.exe
következő helyen C:\Windows\System32\nvidia-smi.exe
található: . Ha nem látja a fájlt, lehetséges, hogy az illesztőprogram telepítése még mindig fut a háttérben. Várjon 10 percet, és ellenőrizze újra.
2205-nél kisebb verziók
A nvidia-smi.exe
következő helyen C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe
található: . Ha nem látja a fájlt, lehetséges, hogy az illesztőprogram telepítése még mindig fut a háttérben. Várjon 10 percet, és ellenőrizze újra.
Ha az illesztőprogram telepítve van, az alábbi példához hasonló kimenet jelenik meg:
PS C:\Users\Administrator> cd "C:\Program Files\NVIDIA Corporation\NVSMI"
PS C:\Program Files\NVIDIA Corporation\NVSMI> ls
Directory: C:\Program Files\NVIDIA Corporation\NVSMI
Mode LastWriteTime Length Name
---- ------------- ------ ----
-a---- 2/26/2020 12:00 PM 849640 MCU.exe
-a---- 2/26/2020 12:00 PM 443104 nvdebugdump.exe
-a---- 2/25/2020 2:06 AM 81823 nvidia-smi.1.pdf
-a---- 2/26/2020 12:01 PM 566880 nvidia-smi.exe
-a---- 2/26/2020 12:01 PM 991344 nvml.dll
PS C:\Program Files\NVIDIA Corporation\NVSMI> .\nvidia-smi.exe
Wed Dec 16 00:35:51 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 442.50 Driver Version: 442.50 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla T4 TCC | 0000503C:00:00.0 Off | 0 |
| N/A 35C P8 11W / 70W | 8MiB / 15205MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
PS C:\Program Files\NVIDIA Corporation\NVSMI>
További információ: Nvidia GPU driver extension for Windows.
Feljegyzés
A GPU-illesztő és a GPU-bővítmény telepítése után már nem kell internet-hozzáféréssel rendelkező portot használnia a számításhoz.
GPU-bővítmény eltávolítása
A GPU-bővítmény eltávolításához használja a következő parancsot:
Remove-AzureRmVMExtension -ResourceGroupName <Resource group name> -VMName <VM name> -Name <Extension name>
Íme egy mintakimenet:
PS C:\azure-stack-edge-deploy-vms> Remove-AzureRmVMExtension -ResourceGroupName rgl -VMName WindowsVM -Name windowsgpuext
Virtual machine extension removal operation
This cmdlet will remove the specified virtual machine extension. Do you want to continue? [Y] Yes [N] No [S] Suspend [?] Help (default is "Y"): y
Requestld IsSuccessStatusCode StatusCode ReasonPhrase
--------- ------------------- ---------- ------------
True OK OK
Következő lépések
Az alábbiak végrehajtásának módját ismerheti meg:
- GPU-bővítményekkel kapcsolatos problémák elhárítása.
- Virtuálisgép-tevékenység monitorozása az eszközön.
- Virtuálisgép-lemezek kezelése.
- Virtuálisgép-hálózati adapterek kezelése.
- Virtuálisgép-méretek kezelése.