Azure Stack Hub'da grafik işleme birimi (GPU) sanal makinesi (VM)
Bu makalede, Azure Stack Hub tümleşik sisteminde hangi grafik işleme birimi (GPU) modellerinin desteklendiği açıklanmaktadır. GPU'larla kullanılan sürücüleri yükleme yönergelerini de bulabilirsiniz. Azure Stack Hub'daki GPU desteği yapay zeka, eğitim, çıkarım ve veri görselleştirme gibi çözümler sağlar. AMD Radeon Instinct MI25, Autodesk AutoCAD gibi yoğun grafik kullanan uygulamaları desteklemek için kullanılabilir.
Üç GPU modeli arasından seçim yapabilirsiniz. NVIDIA V100, NVIDIA T4 ve AMD MI25 GPU'larında kullanılabilir. Bu fiziksel GPU'lar aşağıdaki Azure N Serisi sanal makine (VM) türleriyle aşağıdaki gibi hizalanır:
Uyarı
GPU VM'leri bu sürümde desteklenmez. Azure Stack Hub 2005 veya sonraki bir sürümüne yükseltmeniz gerekir. Ayrıca Azure Stack Hub donanımınızın fiziksel GPU'ları olmalıdır.
NCv3
NCv3 serisi VM'ler NVIDIA Tesla V100 GPU'lar tarafından desteklenir. Müşteriler rezervuar modelleme, DNA sıralama, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilir.
Size | Sanal işlemci | Bellek: GiB | Geçici depolama (SSD) GiB | GPU | GPU belleği: GiB | Maksimum veri diskleri | En fazla NIC |
---|---|---|---|---|---|---|---|
Standard_NC6s_v3 | 6 | 112 | 736 | 1 | 16 | 12 | 4 |
Standard_NC12s_v3 | 12 | 224 | 1474 | 2 | 32 | 24 | 8 |
Standard_NC24s_v3 | 24 | 448 | 2948 | 4 | 64 | 32 | 8 |
NVv4
NVv4 serisi sanal makineler AMD Radeon Instinct MI25 GPU'ları tarafından desteklenir. NVv4 serisi Azure Stack Hub ile kısmi GPU'ları olan sanal makineleri kullanıma sunuyoruz. Bu boyut GPU hızlandırılmış grafik uygulamaları ve sanal masaüstleri için kullanılabilir. NVv4 sanal makineleri şu anda yalnızca Windows konuk işletim sistemini desteklemektedir.
Size | Sanal işlemci | Bellek: GiB | Geçici depolama (SSD) GiB | GPU | GPU belleği: GiB | Maksimum veri diskleri | En fazla NIC |
---|---|---|---|---|---|---|---|
Standard_NV4as_v4 | 4 | 14 | Kategori 88 | 1/8 | 2 | 4 | 2 |
Standard_NV8as_v4 | 8 | 28 | 176 | 1/4 | 4 | 8 | 4 |
Standard_NV16as_v4 | 16 | 56 | 352 | 1/2 | 8 | 16 | 8 |
Standard_NV32as_v4 | 32 | 112 | 704 | 1 | 16 | 32 | 8 |
NCasT4_v3
Size | Sanal işlemci | Bellek: GiB | GPU | GPU belleği: GiB | Maksimum veri diskleri | En fazla NIC |
---|---|---|---|---|---|---|
Standard_NC4as_T4_v3 | 4 | 28 | 1 | 16 | 8 | 4 |
Standard_NC8as_T4_v3 | 8 | 56 | 1 | 16 | 16 | 8 |
Standard_NC16as_T4_v3 | 16 | 110 | 1 | 16 | 32 | 8 |
Standard_NC64as_T4_v3 | 64 | 440 | 4 | 64 | 32 | 8 |
NC_A100 v4
NC_A100 serisi VM'ler Tesla V100 GPU'larının ardılı olan NVIDIA Ampere A100 GPU'lar tarafından desteklenir. Rezervuar modelleme, DNA sıralama, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilirsiniz.
Size | Sanal işlemci | Bellek: GiB | Geçici depolama (GiB) | Maksimum veri diskleri | GPU | GPU bellek GiB | En fazla NIC |
---|---|---|---|---|---|---|---|
Standard_NC24ads_A100_v4 | 24 | 220 | Kategori 1123 | 12 | 1 | 80 | 2 |
Standard_NC48ads_A100_v4 | 48 | 440 | 2246 | 24 | 2 | 160 | 4 |
GPU sistemiyle ilgili dikkat edilmesi gerekenler
- GPU şu SKU'lardan biri olmalıdır: AMD MI-25, Nvidia V100 (ve çeşitleri), Nvidia T4.
- Desteklenen sunucu başına GPU sayısı (1, 2, 3, 4). Tercih edilenler: 1, 2 ve 4.
- Ölçek birimi boyunca tüm GPU'lar tam olarak aynı SKU'ya sahip olmalıdır.
- Sunucu başına tüm GPU miktarları ölçek birimi boyunca aynı olmalıdır.
- GPU bölüm boyutu (AMD Mi25 için) ölçek birimindeki tüm GPU VM'lerinde aynı olmalıdır.
Kapasite planlaması
Azure Stack Hub kapasite planlayıcısı, GPU yapılandırmalarını destekleyecek şekilde güncelleştirildi. üzerinde erişilebilir https://aka.ms/azstackcapacityplanner.
Mevcut azure stack hub'ına GPU ekleme
Azure Stack Hub artık mevcut herhangi bir sisteme GPU eklemeyi destekliyor. Bunu yapmak için stop-azurestack komutunu yürütebilir, stop-azurestack yordamını çalıştırabilir, GPU'lar ekleyebilir ve ardından tamamlamaya kadar start-azurestack komutunu çalıştırabilirsiniz. Sistemde GPU'lar zaten varsa, önceden oluşturulmuş GPU VM'lerinin serbest bırakılıp yeniden başlatılması gerekir.
VM'lerin düzeltme eki ve güncelleştirme, FRU davranışı
GPU VM'leri, Azure Stack Hub'ın düzeltme eki ve güncelleştirme (PnU) ve donanım değiştirme (FRU) gibi işlemler sırasında kapalı kalma süresinden geçer. Aşağıdaki tabloda, bu etkinlikler sırasında gözlemlenen VM'nin durumu ve bu VM'leri işlemden sonra kullanılabilir hale getirmek için yapabileceğiniz el ile gerçekleştirilen eylem ele alınmaktadır.
İşlem | PnU - Tam Güncelleştirme, OEM güncelleştirmesi | FRU |
---|---|---|
VM durumu | Güncelleştirme sırasında kullanılamaz. El ile işlem ile kullanılabilir hale getirilebilir. VM, güncelleştirme sonrası otomatik olarak çevrimiçidir. | FRU sırasında kullanılamaz. El ile işlem ile kullanılabilir hale getirilebilir. VM'nin FRU'ya geri getirilmesi gerekiyor |
El ile işlem | Güncelleştirme sırasında VM'nin kullanıma sunulması gerekiyorsa, kullanılabilir GPU bölümleri varsa, Vm portaldan Yeniden Başlat düğmesine tıklanarak yeniden başlatılabilir. VM güncelleştirme sonrasında otomatik olarak geri gelecek | VM, FRU sırasında kullanılamaz. Kullanılabilir GPU'lar varsa, VM FRU sırasında durdurulabilir ve yeniden başlatılabilir. FRU tamamlandıktan sonra, VM'nin Durdur düğmesi kullanılarak stop-deallocated olması ve Başlangıç düğmesi kullanılarak yeniden başlatılması gerekir. |
Konuk sürücü yüklemesi
Sürücü yüklemesi için aşağıdaki PowerShell cmdlet'leri kullanılabilir:
$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"
Set-AzureRmVMExtension -Location $Location `
-Publisher $driverPublisher `
-ExtensionType $driverType `
-TypeHandlerVersion $driverVersion `
-VMName $VmName `
-ResourceGroupName $ResourceGroupName `
-Name $driverName `
-Settings $Settings ` # If no settings are set, omit this parameter
-Verbose
Azure Stack Hub GPU VM'nizin işletim sistemine, türüne ve bağlantısına bağlı olarak, aşağıdaki ayarlarla değiştirmeniz gerekir.
AMD MI25
Konuk sürücü sürümü, bağlantı durumundan bağımsız olarak Azure Stack Hub sürümüyle eşleşmelidir. Azure Stack Hub sürümüyle uyumlu olmayan daha yeni sürümlerin kullanılması kullanılabilirlik sorunlarına neden olabilir.
Azure Stack Hub Sürümü | AMD Konuk sürücüsü |
---|---|
2206 | 21.Q2-1, 20.Q4-1 |
2108 | 21.Q2-1, 20.Q4-1 |
2102 | 21.Q2-1, 20.Q4-1 |
Bağlandı
Önceki bölümdeki PowerShell betiğini AMD için uygun sürücü türüyle kullanın. Windows çalıştıran N serisi VM'lere AMD GPU sürücüleri yükleme makalesi, NVv4 GPU-P özellikli VM'nin içinde AMD Radeon Instinct MI25 sürücüsünü yüklemeye ilişkin yönergelerin yanı sıra sürücü yüklemesini doğrulama adımlarını sağlar.
Bağlantı kesildi
Uzantı sürücüyü internet üzerindeki bir konumdan çektiğinden, dış ağ bağlantısı kesilmiş bir VM'ye erişemez. Sürücüyü önceki tablodan indirebilir ve yerel ağınızda VM tarafından erişilebilen bir depolama hesabına yükleyebilirsiniz.
AMD sürücüsünü bir depolama hesabına ekleyin ve içinde bu hesabın URL'sini Settings
belirtin. Bu ayarlar Set-AzureRMVMExtension cmdlet'inde kullanılmalıdır. Örneğin:
$Settings = @{
"DriverURL" = <URL to driver in storage account>
}
NVIDIA
GPU kullanılarak CUDA veya GRID iş yükleri için sanal makineye NVIDIA sürücüleri yüklenmelidir.
Kullanım örneği: grafik/görselleştirme KıLAVUZU
Bu senaryo, GRID sürücülerinin kullanılmasını gerektirir. Gerekli lisanslara sahip olmanız koşuluyla GRID sürücüleri NVIDIA Uygulama Merkezi üzerinden indirilebilir. GRID sürücüleri ayrıca, VM'de GRID sürücülerini kullanmadan önce uygun GRID lisanslarına sahip bir GRID lisans sunucusu gerektirir.
$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="GRID"
}
Kullanım örneği: işlem/CUDA - Bağlan
CUDA sürücülerinin bir lisans sunucusuna ve değiştirilmiş ayarlara ihtiyacı yoktur.
Kullanım örneği: işlem/CUDA - Bağlantısı kesildi
NVIDIA CUDA sürücülerine bağlantılar şu bağlantı kullanılarak edinilebilir: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json
Windows:
$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664";
"DriverType"="CUDA"
}
Linux:
Ayarlarınız için bazı URL'lere başvurmanız gerekir.
URL | Notlar |
---|---|
PUBKEY_URL | PUBKEY_URL, Linux VM için değil Nvidia sürücü deposunun ortak anahtarıdır. Ubuntu sürücüsünü yüklemek için kullanılır. |
DRIVER_URL | DRIVER_URL, Nvidia sürücüsünün depo bilgilerini indirme URL'sidir ve Linux VM'sinin depo listesine eklenir. |
URL'leri ayarlarınıza ekleyin.
$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin