VM’leri yapılandırma ve iyileştirme
Şunlar için geçerlidir: ✔️ Linux VM'leri ✔️ Windows VM'leri ✔️ Esnek ölçek kümeleri ✔️ Tekdüzen ölçek kümeleri
Bu makalede, HPC için InfiniBand özellikli HB serisi ve N serisi VM'leri yapılandırma ve iyileştirme konusunda bazı yönergeler paylaşılır.
VM görüntüleri
InfiniBand (IB) özellikli VM'lerde RDMA'yı etkinleştirmek için uygun IB sürücüleri gerekir.
- Market'teki Ubuntu-HPC VM görüntüleri , uygun NVIDIA IB sürücüleri ve GPU sürücüleriyle önceden yapılandırılmış olarak gelir.
- Market'teki AlmaLinux-HPC VM görüntüleri , uygun NVIDIA IB sürücüleri ve GPU sürücüleriyle önceden yapılandırılmış olarak gelir.
Bu VM görüntüleri, temel Ubuntu ve AlmaLinux market VM görüntülerini temel alır. Bu VM görüntülerinin temel market görüntülerinden oluşturulmasında kullanılan betikler azhpc-images deposunda bulunur.
GPU özellikli N serisi VM'lerde, uygun GPU sürücüleri ek olarak gereklidir. Bu, aşağıdaki yöntemlerle kullanılabilir:
- NVIDIA GPU sürücüleri ve GPU işlem yazılımı yığını (CUDA, NCCL) ile önceden yapılandırılmış olarak gelen Ubuntu-HPC VM görüntülerini veya AlmaLinux-HPC VM görüntülerini kullanın.
- VM uzantıları aracılığıyla GPU sürücülerini ekleyin.
- GPU sürücülerini el ile yükleyin.
- Market'te bulunan diğer bazı VM görüntüleri, NVIDIA'dan bazı VM görüntüleri de dahil olmak üzere NVIDIA GPU sürücüleriyle önceden yüklenmiş olarak gelir.
İş yüklerinin Linux dağıtımı ve sürüm gereksinimlerine bağlı olarak, Azure'da HPC ve AI iş yüklerini kullanmaya başlamanın en kolay yolu, Market'te Ubuntu-HPC VM görüntüleri ve AlmaLinux-HPC VM görüntüleridir. Yeniden kullanım için iş yüküne özgü özelleştirme ve yapılandırma ile özel VM görüntüleri oluşturmanız da önerilir.
HPC VM görüntüleri tarafından desteklenen VM boyutları
InfiniBand OFED desteği
En son Azure HPC market görüntüleri, ConnectX3-Pro InfiniBand kartlarını desteklemeyen Mellanox OFED 5.1 ve üzeri sürümlerle birlikte gelir. ConnectX-3 Pro InfiniBand kartları MOFED 4.9 LTS sürümü gerektirir. Bu VM görüntüleri yalnızca ConnextX-5 ve daha yeni InfiniBand kartlarını destekler. Bu HPC VM görüntülerinde InfiniBand OFED için aşağıdaki VM boyutu destek matrisi:
GPU sürücüsü desteği
Şu anda yalnızca Ubuntu-HPC VM görüntüleri ve AlmaLinux-HPC VM görüntüleri NVIDIA GPU sürücüleri ve GPU işlem yazılımı yığını (CUDA, NCCL) ile önceden yapılandırılmış olarak gelir.
Desteklenen HPC VM görüntülerinde GPU sürücüleri için VM boyutu destek matrisi aşağıdaki gibidir:
- N serisi: NDv2, NDv4 VM boyutları NVIDIA GPU sürücüleri ve GPU işlem yazılımı yığını (CUDA, NCCL) ile desteklenir.
- N serisindeki diğer 'NC' ve 'ND' VM boyutları NVIDIA GPU sürücüleriyle desteklenir.
N serisindeki tüm VM boyutları 2. Nesil VM'leri desteklese de, bazı eskileri 1. Nesil VM'leri de destekler. 2. Nesil desteği, görüntü URN'sinin veya sürümünün sonunda bir "01" ile de belirtilir.
SR-IOV özellikli VM'ler
Ubuntu-HPC VM görüntüleri
SR-IOV özellikli RDMA özellikli VM'ler için Ubuntu-HPC VM görüntüleri 18.04, 20.04 ve 22.04 sürümleri uygundur. Bu VM görüntüleri RDMA, NVIDIA GPU sürücüleri, GPU işlem yazılımı yığını (CUDA, NCCL) ve yaygın olarak kullanılan MPI kitaplıkları ve bilimsel bilgi işlem paketleri için Mellanox OFED sürücüleriyle önceden yapılandırılmış olarak gelir. VM boyutu destek matrisine bakın.
VM görüntülerinin kullanılabilir veya en son sürümleri CLI veya Market kullanılarak aşağıdaki bilgilerle listelenebilir.
"publisher": "Microsoft-DSVM", "offer": "Ubuntu-HPC",
Temel bir Ubuntu Market görüntüsünden Ubuntu-HPC VM görüntülerinin oluşturulmasında kullanılan betikler azhpc-images deposunda bulunur.
AlmaLinux-HPC VM görüntüleri
SR-IOV özellikli RDMA özellikli VM'ler için AlmaLinux-HPC VM görüntüleri 8.5, 8.6 ve 8.7 sürümleri uygundur. Bu VM görüntüleri RDMA, NVIDIA GPU sürücüleri, GPU işlem yazılımı yığını (CUDA, NCCL) ve yaygın olarak kullanılan MPI kitaplıkları ve bilimsel bilgi işlem paketleri için Mellanox OFED sürücüleriyle önceden yapılandırılmış olarak gelir. VM boyutu destek matrisine bakın.
VM görüntülerinin kullanılabilir veya en son sürümleri CLI veya Market kullanılarak aşağıdaki bilgilerle listelenebilir.
"publisher": "AlmaLinux", "offer": "AlmaLinux-HPC",
Temel almaLinux Market görüntüsünden AlmaLinux-HPC VM görüntülerinin oluşturulmasında kullanılan betikler azhpc-images deposunda bulunur.
Ayrıca, Ubuntu-HPC VM görüntülerine ve AlmaLinux-HPC VM görüntülerine nelerin dahil olduğu ve bunların nasıl dağıtılacağı hakkında daha fazla ayrıntı Azure HPC VM görüntülerinde yer alır.
RHEL VM görüntüleri
Market'te temel RHEL tabanlı HPC olmayan VM görüntüleri, SR-IOV özellikli RDMA özellikli VM'lerde kullanılmak üzere yapılandırılabilir. InfiniBand'i etkinleştirme ve VM'lerde MPI'yi ayarlama hakkında daha fazla bilgi edinin.
Ubuntu VM görüntüleri
Market'teki temel Ubuntu Server 20.04 LTS ve 22.04 LTS VM görüntüleri hem SR-IOV hem de SR-IOV olmayan RDMA özellikli VM'ler için desteklenir. InfiniBand'i etkinleştirme ve VM'lerde MPI'yi ayarlama hakkında daha fazla bilgi edinin.
- Ubuntu VM görüntülerinde InfiniBand'i etkinleştirme yönergeleri TechCommunity makalesinde verilmiştir.
Not
Mellanox OFED 5.1 ve üzeri, FDR InfiniBand (örneğin, NCv3) ile SR-IOV özellikli N serisi VM boyutlarında ConnectX3-Pro InfiniBand kartlarını desteklemez. Lütfen ConnectX3-Pro kartlı N serisi VM'lerde LTS Mellanox OFED sürüm 4.9-0.1.7.0 veya üzerini kullanın. Daha fazla bilgi için bkz . Linux InfiniBand Sürücüleri.
SUSE Linux Enterprise Server VM görüntüleri
MARKET'te HPC için SLES 12 SP3, HPC için SLES 12 SP3 (Premium), HPC için SLES 12 SP1, HPC için SLES 12 SP1 (Premium), SLES 12 SP4 ve SLES 15 VM görüntüleri desteklenir. Bu VM görüntüleri RDMA için Ağ Doğrudan sürücüleri (SR-IOV olmayan VM boyutlarında) ve Intel MPI sürüm 5.1 ile önceden yüklenmiş olarak gelir. VM'lerde MPI ayarlama hakkında daha fazla bilgi edinin.
VM'leri iyileştirme
Vm'de gelişmiş performans için bazı isteğe bağlı iyileştirme ayarları aşağıdadır.
LIS'i güncelleştirme
İşlevsellik veya performans için gerekirse, Linux Integration Services (LIS) sürücüleri desteklenen işletim sistemi dağıtımlarına yüklenebilir veya güncelleştirilebilir; özellikle özel görüntü veya RHEL 6.x veya 7.x'in önceki sürümü gibi eski bir işletim sistemi sürümü kullanılarak dağıtılır.
wget https://aka.ms/lis
tar xzf lis
pushd LISISO
sudo ./upgrade.sh
Belleği geri kazanma
Uzak bellek erişimini önlemek için belleği otomatik olarak geri kazanarak performansı geliştirin.
sudo echo 1 >/proc/sys/vm/zone_reclaim_mode
VM yeniden başlatıldıktan sonra bellek modunu kalıcı olarak geri kazanma:
sudo echo "vm.zone_reclaim_mode = 1" >> /etc/sysctl.conf sysctl -p
Güvenlik duvarını ve SELinux'i devre dışı bırakma
sudo systemctl stop iptables.service
sudo systemctl disable iptables.service
sudo systemctl mask firewalld
sudo systemctl stop firewalld.service
sudo systemctl disable firewalld.service
sudo iptables -nL
sudo sed -i -e's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
Cpu gücünü devre dışı bırakma
sudo service cpupower status
Etkinleştirilirse devre dışı bırakın:
sudo service cpupower stop
sudo systemctl disable cpupower
WALinuxAgent'ı yapılandırma
sudo sed -i -e 's/# OS.EnableRDMA=y/OS.EnableRDMA=y/g' /etc/waagent.conf
İsteğe bağlı olarak, WALinuxAgent bir iş çalıştırılmadan önce devre dışı bırakılabilir ve ardından HPC iş yükünde maksimum VM kaynağı kullanılabilirliği için iş sonrası etkinleştirilebilir.
Sonraki adımlar
- InfiniBand özellikli HB serisi ve N serisi VM'lerde InfiniBand'i etkinleştirme hakkında daha fazla bilgi edinin.
- VM'lerde desteklenen çeşitli MPI kitaplıklarını yükleme ve çalıştırma hakkında daha fazla bilgi edinin.
- HBv3 serisine genel bakış ve HC serisine genel bakış'ı gözden geçirin.
- Azure compute Tech Community Bloglarında en son duyurular, HPC iş yükü örnekleri ve performans sonuçları hakkında bilgi edinin.
- Çalışan HPC iş yüklerinin daha yüksek düzeyde mimari görünümü için bkz . Azure'da Yüksek Performanslı Bilgi İşlem (HPC).