VM's configureren en optimaliseren
Van toepassing op: ✔️ Virtuele Linux-machines voor Windows-VM's ✔️ ✔️ Flexibele schaalsets Uniform-schaalsets ✔️
Dit artikel bevat enkele richtlijnen voor het configureren en optimaliseren van de VM's uit de HB-serie en de N-serie voor HPC.
VM-installatiekopieën
Op VM's met InfiniBand (IB) zijn de juiste IB-stuurprogramma's vereist om RDMA in te schakelen.
- De Vm-installatiekopieën van Ubuntu-HPC in Marketplace zijn vooraf geconfigureerd met de juiste NVIDIA IB-stuurprogramma's en GPU-stuurprogramma's.
- De AlmaLinux-HPC VM-installatiekopieën in de Marketplace zijn vooraf geconfigureerd met de juiste NVIDIA IB-stuurprogramma's en GPU-stuurprogramma's.
Deze VM-installatiekopieën zijn gebaseerd op de basisinstallatiekopieën van Ubuntu en AlmaLinux marketplace. Scripts die worden gebruikt bij het maken van deze VM-installatiekopieën op basis van marketplace-installatiekopieën, bevinden zich in de opslagplaats azhpc-images.
Op VM's uit de N-serie met GPU zijn de juiste GPU-stuurprogramma's vereist. Dit kan beschikbaar zijn met de volgende methoden:
- Gebruik de VM-installatiekopieën van Ubuntu-HPC of AlmaLinux-HPC VM-installatiekopieën die vooraf zijn geconfigureerd met de NVIDIA GPU-stuurprogramma's en de GPU-rekensoftwarestack (CUDA, NCCL).
- Voeg de GPU-stuurprogramma's toe via de VM-extensies.
- Installeer de GPU-stuurprogramma's handmatig.
- Sommige andere VM-installatiekopieën op marketplace zijn ook vooraf geïnstalleerd met de NVIDIA GPU-stuurprogramma's, waaronder enkele VM-installatiekopieën van NVIDIA.
Afhankelijk van de Linux-distributie- en versiebehoeften van de workloads zijn Ubuntu-HPC VM-installatiekopieën en AlmaLinux-HPC VM-installatiekopieën op de Marketplace de eenvoudigste manier om aan de slag te gaan met HPC- en AI-workloads in Azure. Het wordt ook aanbevolen om aangepaste VM-installatiekopieën te maken met workloadspecifieke aanpassing en configuratie voor hergebruik.
VM-grootten die worden ondersteund door de HPC VM-installatiekopieën
InfiniBand OFED-ondersteuning
De nieuwste Azure HPC Marketplace-installatiekopieën worden geleverd met Mellanox OFED 5.1 en hoger, die geen ondersteuning bieden voor ConnectX3-Pro InfiniBand-kaarten. ConnectX-3 Pro InfiniBand-kaarten vereisen MOFED 4.9 LTS-versie. Deze VM-installatiekopieën ondersteunen alleen ConnextX-5- en nieuwere InfiniBand-kaarten. De volgende VM-grootteondersteuningsmatrix voor de InfiniBand OFED in deze HPC VM-installatiekopieën:
Ondersteuning voor GPU-stuurprogramma's
Momenteel worden alleen de installatiekopieën van ubuntu-HPC-VM's en AlmaLinux-HPC VM-installatiekopieën vooraf geconfigureerd met de NVIDIA GPU-stuurprogramma's en de GPU-rekensoftwarestack (CUDA, NCCL).
De ondersteuningsmatrix voor DE VM-grootte voor de GPU-stuurprogramma's in ondersteunde HPC VM-installatiekopieën is als volgt:
- N-serie: NDv2, NDv4 VM-grootten worden ondersteund met de NVIDIA GPU-stuurprogramma's en GPU-rekensoftwarestack (CUDA, NCCL).
- De andere VM-grootten 'NC' en 'ND' in de N-serie worden ondersteund met de NVIDIA GPU-stuurprogramma's.
Alle VM-grootten in de N-serie ondersteunen gen 2-VM's, hoewel sommige oudere vm's ook gen 1-VM's ondersteunen. Gen 2-ondersteuning wordt ook aangeduid met een '01' aan het einde van de URN of versie van de installatiekopieën.
VM's met SR-IOV
Ubuntu-HPC VM-installatiekopieën
Voor VM's die geschikt zijn voor SR-IOV, zijn ubuntu-HPC VM-installatiekopieën versie 18.04, 20.04 en 22.04 geschikt. Deze VM-installatiekopieën zijn vooraf geconfigureerd met de Mellanox OFED-stuurprogramma's voor RDMA, NVIDIA GPU-stuurprogramma's, GPU-rekensoftwarestack (CUDA, NCCL) en veelgebruikte MPI-bibliotheken en wetenschappelijke computingpakketten. Raadpleeg de ondersteuningsmatrix voor DE VM-grootte.
De beschikbare of nieuwste versies van de VM-installatiekopieën kunnen worden vermeld met de volgende informatie met behulp van CLI of Marketplace.
"publisher": "Microsoft-DSVM", "offer": "Ubuntu-HPC",
Scripts die worden gebruikt bij het maken van de Ubuntu-HPC VM-installatiekopieën van een basisinstallatiekopie van Ubuntu Marketplace, bevinden zich in de opslagplaats azhpc-images.
AlmaLinux-HPC VM-installatiekopieën
Voor VM's die geschikt zijn voor SR-IOV, zijn AlmaLinux-HPC VM-installatiekopieën versie 8.5, 8.6 en 8.7 geschikt. Deze VM-installatiekopieën zijn vooraf geconfigureerd met de Mellanox OFED-stuurprogramma's voor RDMA, NVIDIA GPU-stuurprogramma's, GPU-rekensoftwarestack (CUDA, NCCL) en veelgebruikte MPI-bibliotheken en wetenschappelijke computingpakketten. Raadpleeg de ondersteuningsmatrix voor DE VM-grootte.
De beschikbare of nieuwste versies van de VM-installatiekopieën kunnen worden vermeld met de volgende informatie met behulp van CLI of Marketplace.
"publisher": "AlmaLinux", "offer": "AlmaLinux-HPC",
Scripts die worden gebruikt bij het maken van de AlmaLinux-HPC VM-installatiekopieën van een basisinstallatiekopie van AlmaLinux Marketplace, bevinden zich in de opslagplaats azhpc-images.
Daarnaast vindt u meer informatie over wat er is opgenomen in de ubuntu-HPC VM-installatiekopieën en AlmaLinux-HPC VM-installatiekopieën en hoe u deze implementeert in Azure HPC VM-installatiekopieën.
RHEL VM-installatiekopieën
De op RHEL gebaseerde niet-HPC VM-installatiekopieën op de Marketplace kunnen worden geconfigureerd voor gebruik op vm's die geschikt zijn voor SR-IOV. Meer informatie over het inschakelen van InfiniBand en het instellen van MPI op de VM's.
Ubuntu VM-installatiekopieën
De basisinstallatiekopieën van Ubuntu Server 20.04 LTS en 22.04 LTS VM's in marketplace worden ondersteund voor VM's die geschikt zijn voor SR-IOV en niet-SR-IOV RDMA. Meer informatie over het inschakelen van InfiniBand en het instellen van MPI op de VM's.
- Instructies voor het inschakelen van InfiniBand op de Ubuntu VM-installatiekopieën staan in een TechCommunity-artikel.
Notitie
Mellanox OFED 5.1 en hoger bieden geen ondersteuning voor ConnectX3-Pro InfiniBand-kaarten op VM-grootten uit de SR-IOV-serie met FDR InfiniBand (bijvoorbeeld NCv3). Gebruik LTS Mellanox OFED versie 4.9-0.1.7.0 of ouder op de VM's uit de N-serie met ConnectX3-Pro-kaarten. Zie Linux InfiniBand-stuurprogramma's voor meer informatie.
SUSE Linux Enterprise Server VM-installatiekopieën
SLES 12 SP3 voor HPC, SLES 12 SP3 voor HPC (Premium), SLES 12 SP1 voor HPC, SLES 12 SP1 voor HPC (Premium), SLES 12 SP4 en SLES 15 VM-installatiekopieën in marketplace worden ondersteund. Deze VM-installatiekopieën worden vooraf geladen met de Network Direct-stuurprogramma's voor RDMA (in de niet-SR-IOV VM-grootten) en Intel MPI versie 5.1. Meer informatie over het instellen van MPI op de VM's.
VM's optimaliseren
Hieronder volgen enkele optionele optimalisatie-instellingen voor verbeterde prestaties op de VIRTUELE machine.
LIS bijwerken
Indien nodig voor functionaliteit of prestaties kunnen LIS-stuurprogramma's (Linux Integration Services) worden geïnstalleerd of bijgewerkt op ondersteunde distributies van besturingssystemen, met name het implementeren met behulp van een aangepaste installatiekopieën of een oudere versie van het besturingssysteem, zoals RHEL 6.x of eerdere versie van 7.x.
wget https://aka.ms/lis
tar xzf lis
pushd LISISO
sudo ./upgrade.sh
Geheugen vrijmaken
Verbeter de prestaties door automatisch geheugen vrij te maken om externe geheugentoegang te voorkomen.
sudo echo 1 >/proc/sys/vm/zone_reclaim_mode
Houd de modus Geheugen vrijmaken permanent nadat de VM opnieuw is opgestart:
sudo echo "vm.zone_reclaim_mode = 1" >> /etc/sysctl.conf sysctl -p
Firewall en SELinux uitschakelen
sudo systemctl stop iptables.service
sudo systemctl disable iptables.service
sudo systemctl mask firewalld
sudo systemctl stop firewalld.service
sudo systemctl disable firewalld.service
sudo iptables -nL
sudo sed -i -e's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
Cpupower uitschakelen
sudo service cpupower status
Als deze optie is ingeschakeld, schakelt u deze uit:
sudo service cpupower stop
sudo systemctl disable cpupower
WALinuxAgent configureren
sudo sed -i -e 's/# OS.EnableRDMA=y/OS.EnableRDMA=y/g' /etc/waagent.conf
Optioneel kan de WALinuxAgent worden uitgeschakeld voordat een taak wordt uitgevoerd, waarna de taak na de taak is ingeschakeld voor maximale beschikbaarheid van VM-resources voor de HPC-workload.
Volgende stappen
- Meer informatie over het inschakelen van InfiniBand op de VM's uit de InfiniBand-serie en N-serie.
- Meer informatie over het installeren en uitvoeren van verschillende ondersteunde MPI-bibliotheken op de VM's.
- Bekijk het overzicht van de HBv3-serie en het overzicht van de HC-serie.
- Lees meer over de nieuwste aankondigingen, voorbeelden van HPC-werkbelastingen en prestatieresultaten in de Blogs van de Azure Compute Tech Community.
- Zie High Performance Computing (HPC) op Azure voor een gedetailleerdere architectuurweergave van HPC-workloads die worden uitgevoerd.