Bagikan melalui


Menginstal ekstensi GPU di VM untuk perangkat GPU Azure Stack Edge Pro Anda

BERLAKU UNTUK:Ya untuk Pro - GPU SKU Azure Stack Edge Pro - GPUYa untuk Pro 2 SKUAzure Stack Edge Pro 2Ya untuk Pro R SKUAzure Stack Edge Pro R

Artikel ini menjelaskan cara menginstal ekstensi driver GPU untuk menginstal driver NVIDIA yang sesuai pada VM GPU yang berjalan di perangkat Azure Stack Edge Anda. Artikel ini mencakup langkah-langkah instalasi untuk menginstal ekstensi GPU menggunakan templat Azure Resource Manager pada komputer virtual Windows dan Linux.

Catatan

  • Di portal Microsoft Azure, Anda dapat menginstal ekstensi GPU selama pembuatan komputer virtual atau setelah komputer virtual digunakan. Untuk langkah dan persyaratan, lihat Menyebarkan komputer virtual GPU.
  • Jika Anda menjalankan Windows 2016 VHD, Anda harus mengaktifkan TLS 1.2 di dalam VM sebelum menginstal ekstensi GPU pada 2205 dan yang lebih tinggi. Untuk langkah-langkah mendetail, lihat Memecahkan masalah ekstensi GPU untuk VM GPU di GPU Azure Stack Edge Pro.

Prasyarat

Sebelum Anda menginstal ekstensi GPU di GPU VM yang berjalan di perangkat Anda, pastikan bahwa:

  1. Anda memiliki akses ke perangkat Azure Stack Edge tempat Anda menyebarkan satu atau beberapa VM GPU. Lihat cara Menyebarkan GPU VM di perangkat Anda.

    • Pastikan bahwa port yang diaktifkan untuk jaringan komputasi di perangkat Anda tersambung ke Internet dan memiliki akses. Driver GPU diunduh melalui akses internet.

      Berikut adalah contoh di mana Port 2 terhubung ke internet dan digunakan untuk mengaktifkan jaringan komputasi. Jika Kubernetes tidak disebarkan di lingkungan Anda, Anda dapat melewati IP node Kubernetes dan penetapan IP layanan eksternal.

      Cuplikan layar panel Komputasi untuk perangkat Azure Stack Edge. Pengaturan komputasi untuk Port 2 disorot.

  2. Unduh templat komputer virtual dan file parameter GPU ke komputer klien. Unzip ke direktori yang Anda gunakan sebagai direktori kerja.

  3. Verifikasi bahwa klien yang akan Anda gunakan untuk mengakses perangkat Anda masih tersambung ke Azure Resource Manager melalui Azure PowerShell. Koneksi ke Azure Resource Manager kedaluwarsa setiap 1,5 jam atau jika perangkat Azure Stack Edge Anda dimulai ulang. Jika ini terjadi, cmdlet apa pun yang Anda jalankan akan mengembalikan pesan kesalahan ke efek bahwa Anda tidak tersambung ke Azure lagi. Anda harus masuk lagi. Untuk instruksi mendetail, lihat Menyambungkan ke Azure Resource Manager di perangkat Azure Stack Edge Anda.

Mengedit file parameter

Tergantung pada sistem operasi komputer virtual Anda, Anda dapat menginstal ekstensi GPU untuk Windows atau untuk Linux.

Untuk menyebarkan driver GPU NVIDIA untuk VM yang ada, edit addGPUExtWindowsVM.parameters.json file parameter lalu sebarkan templat addGPUextensiontoVM.json.

Versi 2205 dan yang lebih tinggi

File addGPUExtWindowsVM.parameters.json mengambil parameter berikut:

"parameters": {
	"vmName": {
	"value": "<name of the VM>"
	},
	"extensionName": {
	"value": "<name for the extension. Example: windowsGpu>"
	},
	"publisher": {
	"value": "Microsoft.HpcCompute"
	},
	"type": {
	"value": "NvidiaGpuDriverWindows"
	},
	"typeHandlerVersion": {
	"value": "1.5"
	},
	"settings": {
	"value": {
	"DriverURL" : "http://us.download.nvidia.com/tesla/511.65/511.65-data-center-tesla-desktop-winserver-2016-2019-2022-dch-international.exe",
	"DriverCertificateUrl" : "https://go.microsoft.com/fwlink/?linkid=871664",
	"DriverType":"CUDA"
	}
	}
	}

Versi yang lebih rendah dari 2205

File addGPUExtWindowsVM.parameters.json mengambil parameter berikut:

"parameters": {
	"vmName": {
	"value": "<name of the VM>"
	},
	"extensionName": {
	"value": "<name for the extension. Example: windowsGpu>"
	},
	"publisher": {
	"value": "Microsoft.HpcCompute"
	},
	"type": {
	"value": "NvidiaGpuDriverWindows"
	},
	"typeHandlerVersion": {
	"value": "1.3"
	},
	"settings": {
	"value": {
	"DriverURL" : "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
	"DriverCertificateUrl" : "https://go.microsoft.com/fwlink/?linkid=871664",
	"DriverType":"CUDA"
	}
	}
	}

Menyebarkan templat

Sebarkan templat addGPUextensiontoVM.json untuk menginstal ekstensi pada VM yang ada.

Jalankan perintah berikut:

$templateFile = "<Path to addGPUextensiontoVM.json>"
$templateParameterFile = "<Path to addGPUExtWindowsVM.parameters.json>"
RGName = "<Name of your resource group>"
New-AzureRmResourceGroupDeployment -ResourceGroupName $RGName -TemplateFile $templateFile -TemplateParameterFile $templateParameterFile -Name "<Name for your deployment>"

Catatan

Penyebaran ekstensi adalah pekerjaan jangka panjang dan membutuhkan waktu sekitar 10 menit untuk diselesaikan.

Berikut adalah sampel output:

PS C:\WINDOWS\system32> "C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json"
C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json
PS C:\WINDOWS\system32> $templateFile = "C:\12-09-2020\ExtensionTemplates\addGPUextensiontoVM.json"
PS C:\WINDOWS\system32> $templateParameterFile = "C:\12-09-2020\ExtensionTemplates\addGPUExtWindowsVM.parameters.json"
PS C:\WINDOWS\system32> $RGName = "myasegpuvm1"
PS C:\WINDOWS\system32> New-AzureRmResourceGroupDeployment -ResourceGroupName $RGName -TemplateFile $templateFile -TemplateParameterFile $templateParameterFile -Name "deployment3"

DeploymentName          : deployment3
ResourceGroupName       : myasegpuvm1
ProvisioningState       : Succeeded
Timestamp               : 12/16/2020 12:18:50 AM
Mode                    : Incremental
TemplateLink            :
Parameters              :
                       Name             Type                       Value
                       ===============  =========================  ==========
                       vmName           String                     VM2
                       extensionName    String                     windowsgpuext
                       publisher        String                     Microsoft.HpcCompute
                       type             String                     NvidiaGpuDriverWindows
                       typeHandlerVersion  String                     1.3
                       settings         Object                     {
                         "DriverURL": "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
                         "DriverCertificateUrl": "https://go.microsoft.com/fwlink/?linkid=871664",
                         "DriverType": "CUDA"
                       }

Outputs                 :
DeploymentDebugLogLevel :
PS C:\WINDOWS\system32>

Melacak penyebaran

Untuk memeriksa status penyebaran ekstensi untuk VM tertentu, buka sesi PowerShell lain (jalankan sebagai administrator), lalu jalankan perintah berikut:

Get-AzureRmVMExtension -ResourceGroupName <Name of resource group> -VMName <Name of VM> -Name <Name of the extension>

Berikut adalah sampel output:

PS C:\WINDOWS\system32> Get-AzureRmVMExtension -ResourceGroupName myasegpuvm1 -VMName VM2 -Name windowsgpuext

ResourceGroupName       : myasegpuvm1
VMName                  : VM2
Name                    : windowsgpuext
Location                : dbelocal
Etag                    : null
Publisher               : Microsoft.HpcCompute
ExtensionType           : NvidiaGpuDriverWindows
TypeHandlerVersion      : 1.3
Id                      : /subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourceGroups/myasegpuvm1/providers/Microsoft.Compute/virtualMachines/VM2/extensions/windowsgpuext
PublicSettings          : {
                            "DriverURL": "http://us.download.nvidia.com/tesla/442.50/442.50-tesla-desktop-winserver-2019-2016-international.exe",
                            "DriverCertificateUrl": "https://go.microsoft.com/fwlink/?linkid=871664",
                            "DriverType": "CUDA"
                          }
ProtectedSettings       :
ProvisioningState       : Creating
Statuses                :
SubStatuses             :
AutoUpgradeMinorVersion : True
ForceUpdateTag          :

PS C:\WINDOWS\system32>

Output eksekusi ekstensi dicatat ke file berikut. Lihat file ini C:\Packages\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\1.3.0.0\Status untuk melacak status penginstalan.

Penginstalan yang message berhasil menampilkan dengan Enable Extension dan status dari success.

"status":  {
                       "formattedMessage":  {
                                                "message":  "Enable Extension",
                                                "lang":  "en"
                                            },
                       "name":  "NvidiaGpuDriverWindows",
                       "status":  "success",

Memverifikasi penginstalan driver

Masuk ke komputer virtual dan jalankan utilitas baris perintah nvidia-smi yang diinstal dengan driver.

Versi 2205 dan yang lebih tinggi

nvidia-smi.exe terletak di C:\Windows\System32\nvidia-smi.exe. Jika Anda tidak melihat file, ada kemungkinan penginstalan driver masih berjalan di latar belakang. Tunggu selama 10 menit dan periksa lagi.

Versi yang lebih rendah dari 2205

nvidia-smi.exe terletak di C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe. Jika Anda tidak melihat file, ada kemungkinan penginstalan driver masih berjalan di latar belakang. Tunggu selama 10 menit dan periksa lagi.

Jika driver telah terinstal, Anda akan melihat output yang mirip dengan sampel berikut:

PS C:\Users\Administrator> cd "C:\Program Files\NVIDIA Corporation\NVSMI"
PS C:\Program Files\NVIDIA Corporation\NVSMI> ls

    Directory: C:\Program Files\NVIDIA Corporation\NVSMI

Mode                LastWriteTime         Length Name
----                -------------         ------ ----
-a----        2/26/2020  12:00 PM         849640 MCU.exe
-a----        2/26/2020  12:00 PM         443104 nvdebugdump.exe
-a----        2/25/2020   2:06 AM          81823 nvidia-smi.1.pdf
-a----        2/26/2020  12:01 PM         566880 nvidia-smi.exe
-a----        2/26/2020  12:01 PM         991344 nvml.dll

PS C:\Program Files\NVIDIA Corporation\NVSMI> .\nvidia-smi.exe
Wed Dec 16 00:35:51 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 442.50       Driver Version: 442.50       CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla T4            TCC  | 0000503C:00:00.0 Off |                    0 |
| N/A   35C    P8    11W /  70W |      8MiB / 15205MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
PS C:\Program Files\NVIDIA Corporation\NVSMI>

Untuk informasi selengkapnya, lihat Ekstensi driver GPU NVIDIA untuk Windows.

Catatan

Setelah Anda selesai menginstal driver GPU dan ekstensi GPU, Anda tidak perlu lagi menggunakan port dengan akses Internet untuk komputasi.

Menghapus ekstensi GPU

Untuk menghapus ekstensi GPU, gunakan perintah berikut:

Remove-AzureRmVMExtension -ResourceGroupName <Resource group name> -VMName <VM name> -Name <Extension name>

Berikut adalah sampel output:

PS C:\azure-stack-edge-deploy-vms> Remove-AzureRmVMExtension -ResourceGroupName rgl -VMName WindowsVM -Name windowsgpuext
Virtual machine extension removal operation
This cmdlet will remove the specified virtual machine extension. Do you want to continue? [Y] Yes [N] No [S] Suspend [?] Help (default is "Y"): y
Requestld IsSuccessStatusCode StatusCode ReasonPhrase
--------- ------------------- ---------- ------------
          True                OK         OK

Langkah berikutnya

Pelajari cara: