Aracılığıyla paylaş


Azure Stack Hub'da grafik işleme birimi (GPU) sanal makinesi (VM)

Bu makalede, Azure Stack Hub tümleşik sisteminde hangi grafik işleme birimi (GPU) modellerinin desteklendiği açıklanmaktadır. GPU'larla kullanılan sürücüleri yükleme yönergelerini de bulabilirsiniz. Azure Stack Hub'daki GPU desteği yapay zeka, eğitim, çıkarım ve veri görselleştirme gibi çözümler sağlar. AMD Radeon Instinct MI25, Autodesk AutoCAD gibi yoğun grafik kullanan uygulamaları desteklemek için kullanılabilir.

Üç GPU modeli arasından seçim yapabilirsiniz. NVIDIA V100, NVIDIA T4 ve AMD MI25 GPU'larında kullanılabilir. Bu fiziksel GPU'lar aşağıdaki Azure N Serisi sanal makine (VM) türleriyle aşağıdaki gibi hizalanır:

Uyarı

GPU VM'leri bu sürümde desteklenmez. Azure Stack Hub 2005 veya sonraki bir sürümüne yükseltmeniz gerekir. Ayrıca Azure Stack Hub donanımınızın fiziksel GPU'ları olmalıdır.

NCv3

NCv3 serisi VM'ler NVIDIA Tesla V100 GPU'lar tarafından desteklenir. Müşteriler rezervuar modelleme, DNA sıralama, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilir.

Size Sanal işlemci Bellek: GiB Geçici depolama (SSD) GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NC6s_v3 6 112 736 1 16 12 4
Standard_NC12s_v3 12 224 1474 2 32 24 8
Standard_NC24s_v3 24 448 2948 4 64 32 8

NVv4

NVv4 serisi sanal makineler AMD Radeon Instinct MI25 GPU'ları tarafından desteklenir. NVv4 serisi Azure Stack Hub ile kısmi GPU'ları olan sanal makineleri kullanıma sunuyoruz. Bu boyut GPU hızlandırılmış grafik uygulamaları ve sanal masaüstleri için kullanılabilir. NVv4 sanal makineleri şu anda yalnızca Windows konuk işletim sistemini desteklemektedir.

Size Sanal işlemci Bellek: GiB Geçici depolama (SSD) GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NV4as_v4 4 14 Kategori 88 1/8 2 4 2
Standard_NV8as_v4 8 28 176 1/4 4 8 4
Standard_NV16as_v4 16 56 352 1/2 8 16 8
Standard_NV32as_v4 32 112 704 1 16 32 8

NCasT4_v3

Size Sanal işlemci Bellek: GiB GPU GPU belleği: GiB Maksimum veri diskleri En fazla NIC
Standard_NC4as_T4_v3 4 28 1 16 8 4
Standard_NC8as_T4_v3 8 56 1 16 16 8
Standard_NC16as_T4_v3 16 110 1 16 32 8
Standard_NC64as_T4_v3 64 440 4 64 32 8

NC_A100 v4

NC_A100 serisi VM'ler Tesla V100 GPU'larının ardılı olan NVIDIA Ampere A100 GPU'lar tarafından desteklenir. Rezervuar modelleme, DNA sıralama, protein analizi, Monte Carlo simülasyonları ve diğerleri gibi geleneksel HPC iş yükleri için bu güncelleştirilmiş GPU'lardan yararlanabilirsiniz.

Size Sanal işlemci Bellek: GiB Geçici depolama (GiB) Maksimum veri diskleri GPU GPU bellek GiB En fazla NIC
Standard_NC24ads_A100_v4 24 220 Kategori 1123 12 1 80 2
Standard_NC48ads_A100_v4 48 440 2246 24 2 160 4

GPU sistemiyle ilgili dikkat edilmesi gerekenler

  • GPU şu SKU'lardan biri olmalıdır: AMD MI-25, Nvidia V100 (ve çeşitleri), Nvidia T4.
  • Desteklenen sunucu başına GPU sayısı (1, 2, 3, 4). Tercih edilenler: 1, 2 ve 4.
  • Ölçek birimi boyunca tüm GPU'lar tam olarak aynı SKU'ya sahip olmalıdır.
  • Sunucu başına tüm GPU miktarları ölçek birimi boyunca aynı olmalıdır.
  • GPU bölüm boyutu (AMD Mi25 için) ölçek birimindeki tüm GPU VM'lerinde aynı olmalıdır.

Kapasite planlaması

Azure Stack Hub kapasite planlayıcısı, GPU yapılandırmalarını destekleyecek şekilde güncelleştirildi. üzerinde erişilebilir https://aka.ms/azstackcapacityplanner.

Mevcut azure stack hub'ına GPU ekleme

Azure Stack Hub artık mevcut herhangi bir sisteme GPU eklemeyi destekliyor. Bunu yapmak için stop-azurestack komutunu yürütebilir, stop-azurestack yordamını çalıştırabilir, GPU'lar ekleyebilir ve ardından tamamlamaya kadar start-azurestack komutunu çalıştırabilirsiniz. Sistemde GPU'lar zaten varsa, önceden oluşturulmuş GPU VM'lerinin serbest bırakılıp yeniden başlatılması gerekir.

VM'lerin düzeltme eki ve güncelleştirme, FRU davranışı

GPU VM'leri, Azure Stack Hub'ın düzeltme eki ve güncelleştirme (PnU) ve donanım değiştirme (FRU) gibi işlemler sırasında kapalı kalma süresinden geçer. Aşağıdaki tabloda, bu etkinlikler sırasında gözlemlenen VM'nin durumu ve bu VM'leri işlemden sonra kullanılabilir hale getirmek için yapabileceğiniz el ile gerçekleştirilen eylem ele alınmaktadır.

İşlem PnU - Tam Güncelleştirme, OEM güncelleştirmesi FRU
VM durumu Güncelleştirme sırasında kullanılamaz. El ile işlem ile kullanılabilir hale getirilebilir. VM, güncelleştirme sonrası otomatik olarak çevrimiçidir. FRU sırasında kullanılamaz. El ile işlem ile kullanılabilir hale getirilebilir. VM'nin FRU'ya geri getirilmesi gerekiyor
El ile işlem Güncelleştirme sırasında VM'nin kullanıma sunulması gerekiyorsa, kullanılabilir GPU bölümleri varsa, Vm portaldan Yeniden Başlat düğmesine tıklanarak yeniden başlatılabilir. VM güncelleştirme sonrasında otomatik olarak geri gelecek VM, FRU sırasında kullanılamaz. Kullanılabilir GPU'lar varsa, VM FRU sırasında durdurulabilir ve yeniden başlatılabilir. FRU tamamlandıktan sonra, VM'nin Durdur düğmesi kullanılarak stop-deallocated olması ve Başlangıç düğmesi kullanılarak yeniden başlatılması gerekir.

Konuk sürücü yüklemesi

Sürücü yüklemesi için aşağıdaki PowerShell cmdlet'leri kullanılabilir:

$VmName = <VM Name In Portal>
$ResourceGroupName = <Resource Group of VM>
$Location = "redmond"
$driverName = <Give a name to the driver>
$driverPublisher = "Microsoft.HpcCompute"
$driverType = <Specify Driver Type> #GPU Driver Types: "NvidiaGpuDriverWindows"; "NvidiaGpuDriverLinux"; "AmdGpuDriverWindows"
$driverVersion = <Specify Driver Version> #Nvidia Driver Version:"1.3"; AMD Driver Version:"1.0"

Set-AzureRmVMExtension  -Location $Location `
                            -Publisher $driverPublisher `
                            -ExtensionType $driverType `
                            -TypeHandlerVersion $driverVersion `
                            -VMName $VmName `
                            -ResourceGroupName $ResourceGroupName `
                            -Name $driverName `
                            -Settings $Settings ` # If no settings are set, omit this parameter
                            -Verbose

Azure Stack Hub GPU VM'nizin işletim sistemine, türüne ve bağlantısına bağlı olarak, aşağıdaki ayarlarla değiştirmeniz gerekir.

AMD MI25

Konuk sürücü sürümü, bağlantı durumundan bağımsız olarak Azure Stack Hub sürümüyle eşleşmelidir. Azure Stack Hub sürümüyle uyumlu olmayan daha yeni sürümlerin kullanılması kullanılabilirlik sorunlarına neden olabilir.

Azure Stack Hub Sürümü AMD Konuk sürücüsü
2206 21.Q2-1, 20.Q4-1
2108 21.Q2-1, 20.Q4-1
2102 21.Q2-1, 20.Q4-1

Bağlandı

Önceki bölümdeki PowerShell betiğini AMD için uygun sürücü türüyle kullanın. Windows çalıştıran N serisi VM'lere AMD GPU sürücüleri yükleme makalesi, NVv4 GPU-P özellikli VM'nin içinde AMD Radeon Instinct MI25 sürücüsünü yüklemeye ilişkin yönergelerin yanı sıra sürücü yüklemesini doğrulama adımlarını sağlar.

Bağlantı kesildi

Uzantı sürücüyü internet üzerindeki bir konumdan çektiğinden, dış ağ bağlantısı kesilmiş bir VM'ye erişemez. Sürücüyü önceki tablodan indirebilir ve yerel ağınızda VM tarafından erişilebilen bir depolama hesabına yükleyebilirsiniz.

AMD sürücüsünü bir depolama hesabına ekleyin ve içinde bu hesabın URL'sini Settingsbelirtin. Bu ayarlar Set-AzureRMVMExtension cmdlet'inde kullanılmalıdır. Örneğin:

$Settings = @{
"DriverURL" = <URL to driver in storage account>
}

NVIDIA

GPU kullanılarak CUDA veya GRID iş yükleri için sanal makineye NVIDIA sürücüleri yüklenmelidir.

Kullanım örneği: grafik/görselleştirme KıLAVUZU

Bu senaryo, GRID sürücülerinin kullanılmasını gerektirir. Gerekli lisanslara sahip olmanız koşuluyla GRID sürücüleri NVIDIA Uygulama Merkezi üzerinden indirilebilir. GRID sürücüleri ayrıca, VM'de GRID sürücülerini kullanmadan önce uygun GRID lisanslarına sahip bir GRID lisans sunucusu gerektirir.

$Settings = @{
"DriverURL" = "https://download.microsoft.com/download/e/8/2/e8257939-a439-4da8-a927-b64b63743db1/431.79_grid_win10_server2016_server2019_64bit_international.exe"; "DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="GRID"
}

Kullanım örneği: işlem/CUDA - Bağlan

CUDA sürücülerinin bir lisans sunucusuna ve değiştirilmiş ayarlara ihtiyacı yoktur.

Kullanım örneği: işlem/CUDA - Bağlantısı kesildi

NVIDIA CUDA sürücülerine bağlantılar şu bağlantı kullanılarak edinilebilir: https://raw.githubusercontent.com/Azure/azhpc-extensions/master/NvidiaGPU/resources.json

Windows:

$Settings = @{
"DriverURL" = "";
"DriverCertificateUrl" = "https://go.microsoft.com/fwlink/?linkid=871664"; 
"DriverType"="CUDA"
}

Linux:

Ayarlarınız için bazı URL'lere başvurmanız gerekir.

URL Notlar
PUBKEY_URL PUBKEY_URL, Linux VM için değil Nvidia sürücü deposunun ortak anahtarıdır. Ubuntu sürücüsünü yüklemek için kullanılır.
DRIVER_URL DRIVER_URL, Nvidia sürücüsünün depo bilgilerini indirme URL'sidir ve Linux VM'sinin depo listesine eklenir.

URL'leri ayarlarınıza ekleyin.

$Settings=@{
"isCustomInstall"=$true;
"DRIVER_URL"="https://go.microsoft.com/fwlink/?linkid=874273";
"CUDA_ver"="10.0.130";
"PUBKEY_URL"="http://download.microsoft.com/download/F/F/A/FFAC979D-AD9C-4684-A6CE-C92BB9372A3B/7fa2af80.pub";
"DKMS_URL"="https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm";
"LIS_URL"="https://aka.ms/lis";
"LIS_RHEL_ver"="3.10.0-1062.9.1.el7"
}

Sonraki adımlar