Mesin virtual (VM) unit pemroses grafis (GPU) di Azure Stack Hub
Artikel ini menjelaskan model unit pemrosesan grafis (GPU) mana yang didukung pada sistem terintegrasi Azure Stack Hub. Artikel ini juga berisi instruksi tentang menginstal driver yang digunakan dengan GPU. Dukungan GPU di Azure Stack Hub memungkinkan solusi seperti AI, pelatihan, inferensi, dan visualisasi data. AMD Radeon Instinct MI25 dapat digunakan untuk mendukung aplikasi intensif grafis seperti Autodesk AutoCAD.
Anda dapat memilih dari tiga model GPU. GPU tersebut tersedia di GPU NVIDIA V100, NVIDIA T4, dan AMD MI25. GPU fisik ini selaras dengan jenis mesin virtual (VM) Azure N-Series berikut ini:
Peringatan
GPU VM tidak didukung dalam rilis ini. Anda harus meningkatkan ke Azure Stack Hub 2005 atau yang lebih baru. Selain itu, perangkat keras Azure Stack Hub Anda harus memiliki GPU fisik.
NCv3
VM seri NCv3 didukung oleh GPU NVIDIA Tesla V100. Pelanggan dapat memanfaatkan GPU yang diperbarui ini untuk beban kerja HPC tradisional seperti pemodelan reservoir, pengurutan DNA, analisis protein, simulasi Monte Carlo, dan lainnya.
Ukuran | vCPU | Memori: GiB | Penyimpanan sementara (SSD) GiB | GPU | Memori GPU: GiB | Disk data maksimal | NIC Maksimum |
---|---|---|---|---|---|---|---|
Standard_NC6s_v3 | 6 | 112 | 736 | 1 | 16 | 12 | 4 |
Standard_NC12s_v3 | 12 | 224 | 1474 | 2 | 32 | 24 | 8 |
Standard_NC24s_v3 | 24 | 448 | 2948 | 4 | 64 | 32 | 8 |
NVv4
Mesin virtual seri NVv4 didukung oleh GPU AMD Radeon Instinct MI25. Dengan seri NVv4, Azure Stack Hub memperkenalkan komputer virtual dengan GPU parsial. Ukuran ini dapat digunakan untuk aplikasi grafis akselerasi GPU dan desktop virtual. Komputer virtual NVv4 saat ini hanya mendukung sistem operasi tamu Windows.
Ukuran | vCPU | Memori: GiB | Penyimpanan sementara (SSD) GiB | GPU | Memori GPU: GiB | Disk data maksimal | NIC Maksimum |
---|---|---|---|---|---|---|---|
Standard_NV4as_v4 | 4 | 14 | 88 | 1/8 | 2 | 4 | 2 |
Standard_NV8as_v4 | 8 | 28 | 176 | 1/4 | 4 | 8 | 4 |
Standard_NV16as_v4 | 16 | 56 | 352 | 1/2 | 8 | 16 | 8 |
Standard_NV32as_v4 | 32 | 112 | 704 | 1 | 16 | 32 | 8 |
NCasT4_v3
Ukuran | vCPU | Memori: GiB | GPU | Memori GPU: GiB | Disk data maksimal | NIC Maksimum |
---|---|---|---|---|---|---|
Standard_NC4as_T4_v3 | 4 | 28 | 1 | 16 | 8 | 4 |
Standard_NC8as_T4_v3 | 8 | 56 | 1 | 16 | 16 | 8 |
Standard_NC16as_T4_v3 | 16 | 110 | 1 | 16 | 32 | 8 |
Standard_NC64as_T4_v3 | 64 | 440 | 4 | 64 | 32 | 8 |
NC_A100 v4
VM seri NC_A100 didukung oleh GPU NVIDIA Ampere A100, penerus GPU Tesla V100. Anda dapat memanfaatkan GPU yang diperbarui ini untuk beban kerja HPC tradisional seperti pemodelan reservoir, pengurutan DNA, analisis protein, simulasi Monte Carlo, dan lainnya.
Ukuran | vCPU | Memori: GiB | Penyimpanan sementara (GiB) | Disk data maksimal | GPU | GiB memori GPU | NIC Maksimum |
---|---|---|---|---|---|---|---|
Standard_NC24ads_A100_v4 | 24 | 220 | 1123 | 12 | 1 | 80 | 2 |
Standard_NC48ads_A100_v4 | 48 | 440 | 2246 | 24 | 2 | 160 | 4 |
NC_L40S v4
Ukuran | vCPU | Memori: GiB | Penyimpanan sementara (GiB) | Disk data maksimal | GPU | GiB memori GPU | NIC Maksimum |
---|---|---|---|---|---|---|---|
Standard_NC24ads_L40S_v4 | 24 | 220 | 1123 | 8 | 1 | 80 | 2 |
Standard_NC48ads_L40S_v4 | 48 | 440 | 2246 | 16 | 2 | 160 | 4 |
Pertimbangan sistem GPU
- GPU harus menjadi salah satu SKU ini: AMD MI-25, Nvidia V100 (dan varian), Nvidia T4.
- Jumlah GPU per server yang didukung (1, 2, 3, 4). Yang dipilih adalah: 1, 2, dan 4.
- Semua GPU harus memiliki SKU yang sama persis di seluruh unit skala.
- Semua jumlah GPU per server harus sama di seluruh unit skala.
- Ukuran partisi GPU (untuk AMD Mi25) harus sama di seluruh VM GPU pada unit skala.
Perencanaan kapasitas
Perencana kapasitas Azure Stack Hub diperbarui untuk mendukung konfigurasi GPU. Ini dapat diakses di sini.
Menambahkan GPU pada Azure Stack Hub yang sudah ada
Saat ini Azure Stack Hub mendukung penambahan GPU ke sistem yang ada. Untuk menambahkan GPU, jalankan stop-azurestack
, jalankan melalui prosedur stop-azurestack
, tambahkan GPU, lalu jalankan start-azurestack
hingga selesai. Jika sistem sudah memiliki GPU, maka VM GPU yang dibuat sebelumnya harus dan kemudian dimulai stop-deallocated
ulang.
Patch dan update, perilaku FRU VM
VM GPU mengalami waktu henti selama operasi seperti patch dan pembaruan (PnU) dan penggantian perangkat keras (FRU) Azure Stack Hub. Tabel berikut mencakup kondisi VM seperti yang diamati selama aktivitas ini dan tindakan manual yang dapat Anda lakukan untuk membuat VM ini tersedia setelah operasi.
Operasi | PnU - Pembaruan Penuh, pembaruan OEM | FRU |
---|---|---|
Status VM | Tidak tersedia selama pembaruan. Dapat dibuat tersedia dengan operasi manual. VM secara otomatis memperbarui posting online. | Tidak tersedia selama FRU. Dapat dibuat tersedia dengan operasi manual. VM perlu dibawa kembali setelah FRU |
Operasi manual | Jika VM perlu tersedia selama pembaruan, jika ada partisi GPU yang tersedia, VM dapat dihidupkan ulang dari portal dengan mengeklik tombol Hidupkan ulang. VM secara otomatis muncul kembali setelah pembaruan. | VM tidak tersedia selama FRU. Jika ada GPU yang tersedia, VM dapat dialokasikan dan dihidupkan ulang selama FRU. Pasca penyelesaian FRU, VM harus stop-deallocated menggunakan tombol Hentikan , lalu dimulai ulang menggunakan tombol Mulai . |
Penginstalan driver tamu
Cmdlet PowerShell berikut dapat digunakan untuk penginstalan driver:
$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"
Set-AzureRmVMExtension -Location $Location `
-Publisher $driverPublisher `
-ExtensionType $driverType `
-TypeHandlerVersion $driverVersion `
-VMName $VmName `
-ResourceGroupName $ResourceGroupName `
-Name $driverName `
-Settings $Settings ` # If no settings are set, omit this parameter
-Verbose
Bergantung pada OS, jenis, dan konektivitas VM GPU Azure Stack Hub, Anda harus mengganti nilai-nilai ini dengan pengaturan di bawah ini.
AMD MI25
Versi driver tamu harus cocok dengan versi Azure Stack Hub, terlepas dari status konektivitas. Menggunakan versi yang lebih baru yang tidak selaras dengan versi Azure Stack Hub dapat menyebabkan masalah kegunaan.
Versi Azure Stack Hub | Driver Tamu AMD |
---|---|
2206 dan yang lebih baru | 21.Q2-1, 20.Q4-1 |
2108 | 21.Q2-1, 20.Q4-1 |
2102 | 21.Q2-1, 20.Q4-1 |
Tersambung
Gunakan skrip PowerShell di bagian sebelumnya dengan jenis driver yang sesuai untuk AMD. Artikel Menginstal driver GPU AMD pada VM seri N yang menjalankan Windows memberikan instruksi tentang menginstal driver untuk AMD Radeon Instinct MI25 di dalam VM yang diaktifkan GPU-P NVv4, bersama dengan langkah-langkah tentang cara memverifikasi penginstalan driver.
Terputus
Karena ekstensi menarik driver dari lokasi di internet, VM yang terputus dari jaringan eksternal tidak dapat mengaksesnya. Anda dapat mengunduh driver dari tabel sebelumnya dan mengunggah ke akun penyimpanan di jaringan lokal Anda yang dapat diakses oleh VM.
Tambahkan driver AMD ke akun penyimpanan dan tentukan URL ke akun tersebut di Settings
. Pengaturan ini harus digunakan dalam cmdlet Set-AzureRMVMExtension . Contohnya:
$Settings = @{
"DriverURL" = <URL to driver in storage account>
}
NVIDIA
Driver NVIDIA harus diinstal di dalam mesin virtual untuk beban kerja CUDA atau GRID menggunakan GPU.
Kasus penggunaan: grafik/visualisasi GRID
Skenario ini memerlukan penggunaan driver GRID. Driver GRID dapat diunduh melalui NVIDIA Application Hub, asalkan Anda memiliki lisensi yang diperlukan. Driver GRID juga memerlukan server lisensi GRID dengan lisensi GRID yang sesuai sebelum menggunakan driver GRID pada VM.
$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="GRID"
}
Kasus penggunaan: komputasi/CUDA - Terhubung
Driver CUDA tidak memerlukan server lisensi dan tidak memerlukan pengaturan yang dimodifikasi.
Kasus penggunaan: komputasi/CUDA - Terputus
Tautan ke driver NVIDIA CUDA dapat diperoleh menggunakan tautan: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json
Windows:
$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="CUDA"
}
Linux:
Anda harus mereferensikan beberapa URL untuk pengaturan Anda:
URL | Catatan |
---|---|
PUBKEY_URL | PUBKEY_URL adalah kunci publik untuk repositori driver Nvidia, bukan untuk VM Linux. Ini digunakan untuk menginstal driver untuk Ubuntu. |
DRIVER_URL | DRIVER_URL adalah URL untuk mengunduh informasi repositori driver Nvidia dan ditambahkan ke daftar repositori VM Linux. |
Tambahkan URL ke pengaturan Anda.
$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}