Aracılığıyla paylaş


VM’leri yapılandırma ve iyileştirme

Şunlar için geçerlidir: ✔️ Linux VM'leri ✔️ Windows VM'leri ✔️ Esnek ölçek kümeleri ✔️ Tekdüzen ölçek kümeleri

Bu makalede, HPC için InfiniBand özellikli HB serisi ve N serisi VM'leri yapılandırma ve iyileştirme konusunda bazı yönergeler paylaşılır.

VM görüntüleri

InfiniBand (IB) özellikli VM'lerde RDMA'yı etkinleştirmek için uygun IB sürücüleri gerekir.

Bu VM görüntüleri, temel Ubuntu ve AlmaLinux market VM görüntülerini temel alır. Bu VM görüntülerinin temel market görüntülerinden oluşturulmasında kullanılan betikler azhpc-images deposunda bulunur.

GPU özellikli N serisi VM'lerde, uygun GPU sürücüleri ek olarak gereklidir. Bu, aşağıdaki yöntemlerle kullanılabilir:

İş yüklerinin Linux dağıtımı ve sürüm gereksinimlerine bağlı olarak, Azure'da HPC ve AI iş yüklerini kullanmaya başlamanın en kolay yolu, Market'te Ubuntu-HPC VM görüntüleri ve AlmaLinux-HPC VM görüntüleridir. Yeniden kullanım için iş yüküne özgü özelleştirme ve yapılandırma ile özel VM görüntüleri oluşturmanız da önerilir.

HPC VM görüntüleri tarafından desteklenen VM boyutları

InfiniBand OFED desteği

En son Azure HPC market görüntüleri, ConnectX3-Pro InfiniBand kartlarını desteklemeyen Mellanox OFED 5.1 ve üzeri sürümlerle birlikte gelir. ConnectX-3 Pro InfiniBand kartları MOFED 4.9 LTS sürümü gerektirir. Bu VM görüntüleri yalnızca ConnextX-5 ve daha yeni InfiniBand kartlarını destekler. Bu HPC VM görüntülerinde InfiniBand OFED için aşağıdaki VM boyutu destek matrisi:

GPU sürücüsü desteği

Şu anda yalnızca Ubuntu-HPC VM görüntüleri ve AlmaLinux-HPC VM görüntüleri NVIDIA GPU sürücüleri ve GPU işlem yazılımı yığını (CUDA, NCCL) ile önceden yapılandırılmış olarak gelir.

Desteklenen HPC VM görüntülerinde GPU sürücüleri için VM boyutu destek matrisi aşağıdaki gibidir:

  • N serisi: NDv2, NDv4 VM boyutları NVIDIA GPU sürücüleri ve GPU işlem yazılımı yığını (CUDA, NCCL) ile desteklenir.
  • N serisindeki diğer 'NC' ve 'ND' VM boyutları NVIDIA GPU sürücüleriyle desteklenir.

N serisindeki tüm VM boyutları 2. Nesil VM'leri desteklese de, bazı eskileri 1. Nesil VM'leri de destekler. 2. Nesil desteği, görüntü URN'sinin veya sürümünün sonunda bir "01" ile de belirtilir.

SR-IOV özellikli VM'ler

Ubuntu-HPC VM görüntüleri

SR-IOV özellikli RDMA özellikli VM'ler için Ubuntu-HPC VM görüntüleri 18.04, 20.04 ve 22.04 sürümleri uygundur. Bu VM görüntüleri RDMA, NVIDIA GPU sürücüleri, GPU işlem yazılımı yığını (CUDA, NCCL) ve yaygın olarak kullanılan MPI kitaplıkları ve bilimsel bilgi işlem paketleri için Mellanox OFED sürücüleriyle önceden yapılandırılmış olarak gelir. VM boyutu destek matrisine bakın.

  • VM görüntülerinin kullanılabilir veya en son sürümleri CLI veya Market kullanılarak aşağıdaki bilgilerle listelenebilir.

    "publisher": "Microsoft-DSVM",
    "offer": "Ubuntu-HPC",
    
  • Temel bir Ubuntu Market görüntüsünden Ubuntu-HPC VM görüntülerinin oluşturulmasında kullanılan betikler azhpc-images deposunda bulunur.

AlmaLinux-HPC VM görüntüleri

SR-IOV özellikli RDMA özellikli VM'ler için AlmaLinux-HPC VM görüntüleri 8.5, 8.6 ve 8.7 sürümleri uygundur. Bu VM görüntüleri RDMA, NVIDIA GPU sürücüleri, GPU işlem yazılımı yığını (CUDA, NCCL) ve yaygın olarak kullanılan MPI kitaplıkları ve bilimsel bilgi işlem paketleri için Mellanox OFED sürücüleriyle önceden yapılandırılmış olarak gelir. VM boyutu destek matrisine bakın.

  • VM görüntülerinin kullanılabilir veya en son sürümleri CLI veya Market kullanılarak aşağıdaki bilgilerle listelenebilir.

    "publisher": "AlmaLinux",
    "offer": "AlmaLinux-HPC",
    
  • Temel almaLinux Market görüntüsünden AlmaLinux-HPC VM görüntülerinin oluşturulmasında kullanılan betikler azhpc-images deposunda bulunur.

Ayrıca, Ubuntu-HPC VM görüntülerine ve AlmaLinux-HPC VM görüntülerine nelerin dahil olduğu ve bunların nasıl dağıtılacağı hakkında daha fazla ayrıntı Azure HPC VM görüntülerinde yer alır.

RHEL VM görüntüleri

Market'te temel RHEL tabanlı HPC olmayan VM görüntüleri, SR-IOV özellikli RDMA özellikli VM'lerde kullanılmak üzere yapılandırılabilir. InfiniBand'i etkinleştirme ve VM'lerde MPI'yi ayarlama hakkında daha fazla bilgi edinin.

Ubuntu VM görüntüleri

Market'teki temel Ubuntu Server 20.04 LTS ve 22.04 LTS VM görüntüleri hem SR-IOV hem de SR-IOV olmayan RDMA özellikli VM'ler için desteklenir. InfiniBand'i etkinleştirme ve VM'lerde MPI'yi ayarlama hakkında daha fazla bilgi edinin.

  • Ubuntu VM görüntülerinde InfiniBand'i etkinleştirme yönergeleri TechCommunity makalesinde verilmiştir.

Not

Mellanox OFED 5.1 ve üzeri, FDR InfiniBand (örneğin, NCv3) ile SR-IOV özellikli N serisi VM boyutlarında ConnectX3-Pro InfiniBand kartlarını desteklemez. Lütfen ConnectX3-Pro kartlı N serisi VM'lerde LTS Mellanox OFED sürüm 4.9-0.1.7.0 veya üzerini kullanın. Daha fazla bilgi için bkz . Linux InfiniBand Sürücüleri.

SUSE Linux Enterprise Server VM görüntüleri

MARKET'te HPC için SLES 12 SP3, HPC için SLES 12 SP3 (Premium), HPC için SLES 12 SP1, HPC için SLES 12 SP1 (Premium), SLES 12 SP4 ve SLES 15 VM görüntüleri desteklenir. Bu VM görüntüleri RDMA için Ağ Doğrudan sürücüleri (SR-IOV olmayan VM boyutlarında) ve Intel MPI sürüm 5.1 ile önceden yüklenmiş olarak gelir. VM'lerde MPI ayarlama hakkında daha fazla bilgi edinin.

VM'leri iyileştirme

Vm'de gelişmiş performans için bazı isteğe bağlı iyileştirme ayarları aşağıdadır.

LIS'i güncelleştirme

İşlevsellik veya performans için gerekirse, Linux Integration Services (LIS) sürücüleri desteklenen işletim sistemi dağıtımlarına yüklenebilir veya güncelleştirilebilir; özellikle özel görüntü veya RHEL 6.x veya 7.x'in önceki sürümü gibi eski bir işletim sistemi sürümü kullanılarak dağıtılır.

wget https://aka.ms/lis
tar xzf lis
pushd LISISO
sudo ./upgrade.sh

Belleği geri kazanma

Uzak bellek erişimini önlemek için belleği otomatik olarak geri kazanarak performansı geliştirin.

sudo echo 1 >/proc/sys/vm/zone_reclaim_mode

VM yeniden başlatıldıktan sonra bellek modunu kalıcı olarak geri kazanma:

sudo echo "vm.zone_reclaim_mode = 1" >> /etc/sysctl.conf sysctl -p

Güvenlik duvarını ve SELinux'i devre dışı bırakma

sudo systemctl stop iptables.service
sudo systemctl disable iptables.service
sudo systemctl mask firewalld
sudo systemctl stop firewalld.service
sudo systemctl disable firewalld.service
sudo iptables -nL
sudo sed -i -e's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config

Cpu gücünü devre dışı bırakma

sudo service cpupower status

Etkinleştirilirse devre dışı bırakın:

sudo service cpupower stop
sudo systemctl disable cpupower

WALinuxAgent'ı yapılandırma

sudo sed -i -e 's/# OS.EnableRDMA=y/OS.EnableRDMA=y/g' /etc/waagent.conf

İsteğe bağlı olarak, WALinuxAgent bir iş çalıştırılmadan önce devre dışı bırakılabilir ve ardından HPC iş yükünde maksimum VM kaynağı kullanılabilirliği için iş sonrası etkinleştirilebilir.

Sonraki adımlar