Batch havuzlarında RDMA veya GPU örnekleri kullanma

Makale
06/13/2024

Belirli Batch işlerini çalıştırmak için büyük ölçekli hesaplama için tasarlanmış Azure VM boyutlarından yararlanabilirsiniz. Örneğin:

Çok örnekli MPI iş yüklerini çalıştırmak için HB, HC, NC veya ND serisini veya Uzaktan Doğrudan Bellek Erişimi (RDMA) için ağ arabirimi olan diğer boyutları seçin. Bu boyutlar, düğümler arası iletişim için bir InfiniBand ağına bağlanır ve bu da MPI uygulamalarını hızlandırabilir.
CUDA uygulamaları için NVIDIA Tesla grafik işlem birimi (GPU) kartları içeren N serisi boyutları seçin.

Bu makalede, Batch havuzlarında Azure'ın özelleştirilmiş boyutlarından bazılarını kullanmaya yönelik yönergeler ve örnekler sağlanmaktadır. Belirtimler ve arka plan için bkz:

Yüksek performanslı işlem VM boyutları (Linux, Windows)
GPU özellikli VM boyutları (Linux, Windows)

Not

Batch hesaplarınızı oluşturduğunuz bölgelerde belirli VM boyutları kullanılamayabilir. Bir boyutun kullanılabilir olup olmadığını denetlemek için bkz . Bölgeye göre kullanılabilir ürünler ve Batch havuzu için VM boyutu seçme.

Bağımlılıklar

Batch'te işlem yoğunluklu boyutların RDMA veya GPU özellikleri yalnızca belirli işletim sistemlerinde desteklenir. Bu VM boyutları için desteklenen işletim sistemleri, sanal makine oluşturma için kullanılabilenlerin yalnızca bir alt kümesini içerir. Batch havuzunuzu nasıl oluşturduğunuza bağlı olarak, düğümlere ek sürücü veya başka bir yazılım yüklemeniz veya yapılandırmanız gerekebilir. Aşağıdaki tablolarda bu bağımlılıklar özetlenebilir. Ayrıntılar için bağlantılı makalelere bakın. Batch havuzlarını yapılandırma seçenekleri için bu makalenin devamında yer alan bölümüne bakın.

Linux havuzları - Sanal makine yapılandırması

Size	Özellik	İşletim sistemleri	Gerekli yazılım	Havuz ayarları
H16r, H16mr NC24r, NC24rs_v2, NC24rs_v3, ND24rs^*	RDMA	Ubuntu 22.04 LTS (Azure Market)	Intel MPI 5 Linux RDMA sürücüleri	Düğümler arası iletişimi etkinleştirme, eşzamanlı görev yürütmeyi devre dışı bırakma
NCv3, NDv2, NDv4, NDv5 serisi	NVIDIA Tesla GPU (seriye göre değişir)	Ubuntu 22.04 LTS (Azure Market)	NVIDIA CUDA veya CUDA Araç Seti sürücüleri	Yok
NVv3, NVv4, NVv5 serisi	Hızlandırılmış Görselleştirme GPU'su	Ubuntu 22.04 LTS (Azure Market)	NVIDIA GRID sürücüleri (gerekirse)	Yok

^*RDMA özellikli N serisi boyutları da NVIDIA Tesla GPU'larını içerir

Önemli

Bu belge, Linux'un Kullanım Süresi Sonu(EOL) veya yakınında olan bir sürüme başvurur. Lütfen daha güncel bir sürüme güncelleştirmeyi göz önünde bulundurun.

Windows havuzları - Sanal Makine Yapılandırması

Size	Özellik	İşletim sistemleri	Gerekli yazılım	Havuz ayarları
H16r, H16mr NC24r, NC24rs_v2, NC24rs_v3, ND24rs^*	RDMA	Windows Server 2016, 2012 R2 veya 2012 (Azure Market)	Microsoft MPI 2012 R2 veya üzeri veya Intel MPI 5 Windows RDMA sürücüleri	Düğümler arası iletişimi etkinleştirme, eşzamanlı görev yürütmeyi devre dışı bırakma
NC, NCv2, NCv3, ND, NDv2 serisi	NVIDIA Tesla GPU (seriye göre değişir)	Windows Server 2016 veya 2012 R2 (Azure Market)	NVIDIA CUDA veya CUDA Araç Seti sürücüleri	Yok
NV, NVv2, NVv4 serisi	NVIDIA Tesla M60 GPU	Windows Server 2016 veya 2012 R2 (Azure Market)	NVIDIA GRID sürücüleri	Yok

^*RDMA özellikli N serisi boyutları da NVIDIA Tesla GPU'larını içerir

Windows havuzları - Cloud Services Yapılandırması

Uyarı

Cloud Services Yapılandırma havuzları kullanım dışıdır. Lütfen bunun yerine Sanal Makine Yapılandırma havuzlarını kullanın.

Size	Özellik	İşletim sistemleri	Gerekli yazılım	Havuz ayarları
H16r, H16mr	RDMA	Windows Server 2016, 2012 R2, 2012 veya 2008 R2 (Konuk işletim sistemi ailesi)	Microsoft MPI 2012 R2 veya üzeri veya Intel MPI 5 Windows RDMA sürücüleri	Düğümler arası iletişimi etkinleştirin, eşzamanlı görev yürütmeyi devre dışı bırakma

Not

N serisi boyutları Cloud Services Yapılandırma havuzlarında desteklenmez.

Havuz yapılandırma seçenekleri

Batch havuzunuz için özelleştirilmiş bir VM boyutu yapılandırmak için gerekli yazılımları veya sürücüleri yüklemek için çeşitli seçenekleriniz vardır:

Sanal makine yapılandırmasındaki havuzlar için sürücülerin ve yazılımların önceden yüklenmiş olduğu önceden yapılandırılmış bir Azure Market VM görüntüsü seçin. Örnekler:
Linux veya Windows için Veri Bilimi Sanal Makinesi - NVIDIA CUDA sürücülerini içerir
GPU ve RDMA sürücülerini de içeren Batch kapsayıcı iş yükleri için Linux görüntüleri:
Azure Batch kapsayıcı havuzları için Ubuntu Sunucusu (GPU ve RDMA sürücüleriyle)
Vm boyutu için gereken yüklü sürücüler, yazılımlar veya diğer ayarlarla özel bir Windows veya Linux VM görüntüsü oluşturun.
Sıkıştırılmış bir sürücüden veya uygulama yükleyicisinden Bir Batch uygulama paketi oluşturun. Ardından Batch'i bu paketi havuz düğümlerine dağıtacak ve her düğüm oluşturulduğunda bir kez yükleyecek şekilde yapılandırın. Örneğin, uygulama paketi bir yükleyiciyse, uygulamayı tüm havuz düğümlerine sessizce yüklemek için bir başlangıç görevi komut satırı oluşturun. İş yükünüz belirli bir sürücü sürümüne bağlıysa bir uygulama paketi ve havuz başlangıç görevi kullanmayı göz önünde bulundurun.

Not

Başlangıç görevi yükseltilmiş (yönetici) izinlerle çalışmalı ve başarıyı beklemelidir. Uzun süre çalışan görevler Batch havuzu sağlama süresini artırır.

Örnek: Windows NC VM havuzunda NVIDIA GPU sürücüleri

CUDA uygulamalarını bir Windows NC düğümleri havuzunda çalıştırmak için NVDIA GPU sürücülerini yüklemeniz gerekir. Aşağıdaki örnek adımlarda NVIDIA GPU sürücülerini yüklemek için bir uygulama paketi kullanılır. İş yükünüz belirli bir GPU sürücüsü sürümüne bağlıysa bu seçeneği belirleyebilirsiniz.

Windows Server 2016'da GPU sürücüleri için NVIDIA web sitesinden (örneğin, sürüm 411.82) bir kurulum paketi indirin. dosyayı GPUDriverSetup.exe gibi kısa bir ad kullanarak yerel olarak kaydedin.
Paketin zip dosyasını oluşturun.
Paketi Batch hesabınıza yükleyin. Adımlar için uygulama paketleri kılavuzuna bakın. GPUDriver gibi bir uygulama kimliği ve 411.82 gibi bir sürüm belirtin.
Batch API'lerini veya Azure portalını kullanarak sanal makine yapılandırmasında istenen sayıda düğüm ve ölçekle bir havuz oluşturun. Aşağıdaki tabloda, bir başlangıç görevi kullanarak NVIDIA GPU sürücülerini sessizce yüklemek için örnek ayarlar gösterilmektedir:

Ayar	Value
Görüntü Türü	Market (Linux/Windows)
Yayımcı	MicrosoftWindowsServer
Teklif	WindowsServer
Sku	2016-Datacenter
Düğüm boyutu	NC6 Standard
Uygulama paketi başvuruları	GPUDriver, sürüm 411.82
Görevi başlat etkin	True Komut satırı - `cmd /c "%AZ_BATCH_APP_PACKAGE_GPUDriver#411.82%\\GPUDriverSetup.exe /s"` Kullanıcı kimliği - Havuz otomatik kullanıcısı, yönetici Başarıyı bekle - Doğru

Örnek: Linux NC VM havuzunda NVIDIA GPU sürücüleri

CUDA uygulamalarını Linux NC düğümlerinden oluşan bir havuzda çalıştırmak için CUDA Toolkit'ten gerekli NVIDIA Tesla GPU sürücülerini yüklemeniz gerekir. Aşağıdaki örnek adımlar GPU sürücüleriyle özel bir Ubuntu 22.04 LTS görüntüsü oluşturup dağıtır:

Ubuntu 22.04 LTS çalıştıran bir Azure NC serisi VM dağıtın. Örneğin, VM'yi ABD Orta Güney bölgesinde oluşturun.
Azure portalını , Azure aboneliğine bağlanan bir istemci bilgisayarı veya Azure Cloud Shell'i kullanarak NVIDIA GPU Sürücüleri uzantısını VM'ye ekleyin. Alternatif olarak, VM'ye bağlanma ve CUDA sürücülerini el ile yükleme adımlarını izleyin.
Batch için Azure İşlem Galerisi görüntüsü oluşturma adımlarını izleyin.
NC VM'lerini destekleyen bir bölgede Batch hesabı oluşturun.
Batch API'lerini veya Azure portalını kullanarak, özel görüntüyü kullanarak ve istenen sayıda düğüm ve ölçekle bir havuz oluşturun. Aşağıdaki tabloda, görüntü için örnek havuz ayarları gösterilmektedir:

Ayar	Value
Görüntü Türü	Özel Görüntü
Özel Görüntü	Görüntünün adı
Düğüm aracısı SKU'su	batch.node.ubuntu 22.04
Düğüm boyutu	NC6 Standard

Örnek: Windows H16r VM havuzunda Microsoft MPI

Windows MPI uygulamalarını Azure H16r VM düğümleri havuzunda çalıştırmak için HpcVmDrivers uzantısını yapılandırmanız ve Microsoft MPI'yi yüklemeniz gerekir. Gerekli sürücüler ve yazılımla özel bir Windows Server 2016 görüntüsü dağıtmaya yönelik örnek adımlar şunlardır:

Windows Server 2016 çalıştıran bir Azure H16r VM dağıtın. Örneğin, VM'yi ABD Batı bölgesinde oluşturun.
Azure aboneliğinize bağlanan bir istemci bilgisayardan Azure PowerShell komutu çalıştırarak veya Azure Cloud Shell kullanarak HpcVmDrivers uzantısını VM'ye ekleyin.
VM'ye Uzak Masaüstü bağlantısı oluşturun.
Microsoft MPI'nin en son sürümü için kurulum paketini (MSMpiSetup.exe) indirin ve Microsoft MPI'yi yükleyin.
Batch için Azure İşlem Galerisi görüntüsü oluşturma adımlarını izleyin.
Batch API'lerini veya Azure portalını kullanarak Azure İşlem Galerisi'ni kullanarak ve istenen sayıda düğüm ve ölçekle bir havuz oluşturun. Aşağıdaki tabloda, görüntü için örnek havuz ayarları gösterilmektedir:

Ayar	Value
Görüntü Türü	Özel Görüntü
Özel Görüntü	Görüntünün adı
Düğüm aracısı SKU'su	batch.node.windows amd64
Düğüm boyutu	H16r Standard
Düğümler arası iletişim etkinleştirildi	True
Düğüm başına en fazla görev	1

Sonraki adımlar

MPI işlerini bir Azure Batch havuzunda çalıştırmak için Windows veya Linux örneklerine bakın.

Aracılığıyla paylaş