Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
BERLAKU UNTUK: Azure Stack Edge Pro - GPU
Azure Stack Edge Pro 2
Azure Stack Edge Pro R
Artikel ini menjelaskan cara menginstal ekstensi driver GPU untuk menginstal driver NVIDIA yang sesuai pada VM GPU yang berjalan di perangkat Azure Stack Edge Anda. Artikel ini mencakup langkah-langkah instalasi untuk menginstal ekstensi GPU menggunakan templat Azure Resource Manager pada komputer virtual Windows dan Linux.
Catatan
- Di portal Microsoft Azure, Anda dapat menginstal ekstensi GPU selama pembuatan komputer virtual atau setelah komputer virtual digunakan. Untuk langkah dan persyaratan, lihat Menyebarkan komputer virtual GPU.
- Jika Anda menjalankan Windows 2016 VHD, Anda harus mengaktifkan TLS 1.2 di dalam VM sebelum menginstal ekstensi GPU pada 2205 dan yang lebih tinggi. Untuk langkah-langkah mendetail, lihat Memecahkan masalah ekstensi GPU untuk VM GPU di GPU Azure Stack Edge Pro.
Prasyarat
Sebelum Anda menginstal ekstensi GPU di GPU VM yang berjalan di perangkat Anda, pastikan bahwa:
Anda memiliki akses ke perangkat Azure Stack Edge tempat Anda menyebarkan satu atau beberapa VM GPU. Lihat cara Menyebarkan GPU VM di perangkat Anda.
Pastikan bahwa port yang diaktifkan untuk jaringan komputasi di perangkat Anda tersambung ke Internet dan memiliki akses. Driver GPU diunduh melalui akses internet.
Berikut adalah contoh di mana Port 2 terhubung ke internet dan digunakan untuk mengaktifkan jaringan komputasi. Jika Kubernetes tidak disebarkan di lingkungan Anda, Anda dapat melewati IP node Kubernetes dan penetapan IP layanan eksternal.
Unduh templat komputer virtual dan file parameter GPU ke komputer klien. Unzip ke direktori yang Anda gunakan sebagai direktori kerja.
Verifikasi bahwa klien yang akan Anda gunakan untuk mengakses perangkat Anda masih tersambung ke Azure Resource Manager melalui Azure PowerShell. Koneksi ke Azure Resource Manager kedaluwarsa setiap 1,5 jam atau jika perangkat Azure Stack Edge Anda dimulai ulang. Jika ini terjadi, cmdlet apa pun yang Anda jalankan akan mengembalikan pesan kesalahan ke efek bahwa Anda tidak tersambung ke Azure lagi. Anda harus masuk lagi. Untuk instruksi mendetail, lihat Menyambungkan ke Azure Resource Manager di perangkat Azure Stack Edge Anda.
Mengedit file parameter
Tergantung pada sistem operasi komputer virtual Anda, Anda dapat menginstal ekstensi GPU untuk Windows atau untuk Linux.
Untuk menyebarkan driver GPU NVIDIA untuk VM yang ada, edit addGPUExtWindowsVM.parameters.json
file parameter lalu sebarkan templat addGPUextensiontoVM.json
.
Versi 2205 dan yang lebih tinggi
File addGPUExtWindowsVM.parameters.json
mengambil parameter berikut:
"parameters": {
"vmName": {
"value": "<name of the VM>"
},
"extensionName": {
"value": "<name for the extension. Example: windowsGpu>"
},
"publisher": {
"value": "Microsoft.HpcCompute"
},
"type": {
"value": "NvidiaGpuDriverWindows"
},
"typeHandlerVersion": {
"value": "1.5"
},
"settings": {
"value": {
"DriverURL" : "http://us.download.nvidia.com/tesla/511.65/511.65-data-center-tesla-desktop-winserver-2016-2019-2022-dch-international.exe",
"DriverCertificateUrl" : "https://go.microsoft.com/fwlink/?linkid=871664",
"DriverType":"CUDA"
}
}
}
Versi yang lebih rendah dari 2205
File addGPUExtWindowsVM.parameters.json
mengambil parameter berikut:
"parameters": {
"vmName": {
"value": "<name of the VM>"
},
"extensionName": {
"value": "<name for the extension. Example: windowsGpu>"
},
"publisher": {
"value": "Microsoft.HpcCompute"
},
"type": {
"value": "NvidiaGpuDriverWindows"
},
"typeHandlerVersion": {
"value": "1.3"
},
"settings": {
"value": {
"DriverURL" : "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
"DriverCertificateUrl" : "https://go.microsoft.com/fwlink/?linkid=871664",
"DriverType":"CUDA"
}
}
}
Menyebarkan templat
Sebarkan templat addGPUextensiontoVM.json
untuk menginstal ekstensi pada VM yang ada.
Jalankan perintah berikut:
$templateFile = "<Path to addGPUextensiontoVM.json>"
$templateParameterFile = "<Path to addGPUExtWindowsVM.parameters.json>"
RGName = "<Name of your resource group>"
New-AzureRmResourceGroupDeployment -ResourceGroupName $RGName -TemplateFile $templateFile -TemplateParameterFile $templateParameterFile -Name "<Name for your deployment>"
Catatan
Penyebaran ekstensi adalah pekerjaan jangka panjang dan membutuhkan waktu sekitar 10 menit untuk diselesaikan.
Berikut adalah sampel output:
PS C:\WINDOWS\system32> "C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json"
C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json
PS C:\WINDOWS\system32> $templateFile = "C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json"
PS C:\WINDOWS\system32> $templateParameterFile = "C:\12-09-2020\ExtensionTemplates\addGPUExtWindowsVM.parameters.json"
PS C:\WINDOWS\system32> $RGName = "myasegpuvm1"
PS C:\WINDOWS\system32> New-AzureRmResourceGroupDeployment -ResourceGroupName $RGName -TemplateFile $templateFile -TemplateParameterFile $templateParameterFile -Name "deployment3"
DeploymentName : deployment3
ResourceGroupName : myasegpuvm1
ProvisioningState : Succeeded
Timestamp : 12/16/2020 12:18:50 AM
Mode : Incremental
TemplateLink :
Parameters :
Name Type Value
=============== ========================= ==========
vmName String VM2
extensionName String windowsgpuext
publisher String Microsoft.HpcCompute
type String NvidiaGpuDriverWindows
typeHandlerVersion String 1.3
settings Object {
"DriverURL": "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
"DriverCertificateUrl": "https://go.microsoft.com/fwlink/?linkid=871664",
"DriverType": "CUDA"
}
Outputs :
DeploymentDebugLogLevel :
PS C:\WINDOWS\system32>
Melacak penyebaran
Untuk memeriksa status penyebaran ekstensi untuk VM tertentu, buka sesi PowerShell lain (jalankan sebagai administrator), lalu jalankan perintah berikut:
Get-AzureRmVMExtension -ResourceGroupName <Name of resource group> -VMName <Name of VM> -Name <Name of the extension>
Berikut adalah sampel output:
PS C:\WINDOWS\system32> Get-AzureRmVMExtension -ResourceGroupName myasegpuvm1 -VMName VM2 -Name windowsgpuext
ResourceGroupName : myasegpuvm1
VMName : VM2
Name : windowsgpuext
Location : dbelocal
Etag : null
Publisher : Microsoft.HpcCompute
ExtensionType : NvidiaGpuDriverWindows
TypeHandlerVersion : 1.3
Id : /subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourceGroups/myasegpuvm1/providers/Microsoft.Compute/virtualMachines/VM2/extensions/windowsgpuext
PublicSettings : {
"DriverURL": "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
"DriverCertificateUrl": "https://go.microsoft.com/fwlink/?linkid=871664",
"DriverType": "CUDA"
}
ProtectedSettings :
ProvisioningState : Creating
Statuses :
SubStatuses :
AutoUpgradeMinorVersion : True
ForceUpdateTag :
PS C:\WINDOWS\system32>
Output eksekusi ekstensi dicatat ke file berikut. Lihat file ini C:\Packages\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\1.3.0.0\Status
untuk melacak status penginstalan.
Penginstalan yang message
berhasil menampilkan dengan Enable Extension
dan status
dari success
.
"status": {
"formattedMessage": {
"message": "Enable Extension",
"lang": "en"
},
"name": "NvidiaGpuDriverWindows",
"status": "success",
Memverifikasi penginstalan driver
Masuk ke komputer virtual dan jalankan utilitas baris perintah nvidia-smi yang diinstal dengan driver.
Versi 2205 dan yang lebih tinggi
nvidia-smi.exe
terletak di C:\Windows\System32\nvidia-smi.exe
. Jika Anda tidak melihat file, ada kemungkinan penginstalan driver masih berjalan di latar belakang. Tunggu selama 10 menit dan periksa lagi.
Versi yang lebih rendah dari 2205
nvidia-smi.exe
terletak di C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe
. Jika Anda tidak melihat file, ada kemungkinan penginstalan driver masih berjalan di latar belakang. Tunggu selama 10 menit dan periksa lagi.
Jika driver telah terinstal, Anda akan melihat output yang mirip dengan sampel berikut:
PS C:\Users\Administrator> cd "C:\Program Files\NVIDIA Corporation\NVSMI"
PS C:\Program Files\NVIDIA Corporation\NVSMI> ls
Directory: C:\Program Files\NVIDIA Corporation\NVSMI
Mode LastWriteTime Length Name
---- ------------- ------ ----
-a---- 2/26/2020 12:00 PM 849640 MCU.exe
-a---- 2/26/2020 12:00 PM 443104 nvdebugdump.exe
-a---- 2/25/2020 2:06 AM 81823 nvidia-smi.1.pdf
-a---- 2/26/2020 12:01 PM 566880 nvidia-smi.exe
-a---- 2/26/2020 12:01 PM 991344 nvml.dll
PS C:\Program Files\NVIDIA Corporation\NVSMI> .\nvidia-smi.exe
Wed Dec 16 00:35:51 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 442.50 Driver Version: 442.50 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla T4 TCC | 0000503C:00:00.0 Off | 0 |
| N/A 35C P8 11W / 70W | 8MiB / 15205MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
PS C:\Program Files\NVIDIA Corporation\NVSMI>
Untuk informasi selengkapnya, lihat Ekstensi driver GPU NVIDIA untuk Windows.
Catatan
Setelah Anda selesai menginstal driver GPU dan ekstensi GPU, Anda tidak perlu lagi menggunakan port dengan akses Internet untuk komputasi.
Menghapus ekstensi GPU
Untuk menghapus ekstensi GPU, gunakan perintah berikut:
Remove-AzureRmVMExtension -ResourceGroupName <Resource group name> -VMName <VM name> -Name <Extension name>
Berikut adalah sampel output:
PS C:\azure-stack-edge-deploy-vms> Remove-AzureRmVMExtension -ResourceGroupName rgl -VMName WindowsVM -Name windowsgpuext
Virtual machine extension removal operation
This cmdlet will remove the specified virtual machine extension. Do you want to continue? [Y] Yes [N] No [S] Suspend [?] Help (default is "Y"): y
Requestld IsSuccessStatusCode StatusCode ReasonPhrase
--------- ------------------- ---------- ------------
True OK OK
Langkah berikutnya
Pelajari cara: