Obliczenia o wysokiej wydajności na maszynach wirtualnych z obsługą technologii InfiniBand z serii HB i N

Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows — elastyczne zestawy ✔️ ✔️ skalowania jednolite zestawy skalowania

Maszyny wirtualne z serii H i N platformy Azure z obsługą rozwiązania InfiniBand zostały zaprojektowane w celu zapewnienia wydajności klasy przywództwa, skalowalności interfejsu Message Passing Interface (MPI) i wydajności kosztowej dla różnych rzeczywistych obciążeń HPC i sztucznej inteligencji. Te maszyny wirtualne zoptymalizowane pod kątem wysokiej wydajności (HPC) służą do rozwiązywania niektórych najbardziej wymagających obliczeń problemów z nauką i inżynierią, takich jak dynamika płynów, modelowanie ziemi, symulacje pogody itp.

W tych artykułach opisano, jak rozpocząć pracę z maszynami wirtualnymi serii H i N z obsługą rozwiązania InfiniBand na platformie Azure, a także optymalną konfiguracją obciążeń HPC i AI na maszynach wirtualnych w celu zapewnienia skalowalności.

Funkcje i możliwości

Maszyny wirtualne z serii HB i N z obsługą rozwiązania InfiniBand zostały zaprojektowane w celu zapewnienia najlepszej wydajności HPC, skalowalności MPI i wydajności kosztów obciążeń HPC. Zobacz Maszyny wirtualne serii HB i N, aby dowiedzieć się więcej o funkcjach i możliwościach maszyn wirtualnych.

RDMA i InfiniBand

Maszyny wirtualne serii HB i N zobsługą funkcji RDMA komunikują się za pośrednictwem sieci InfiniBand o małych opóźnieniach i wysokiej przepustowości. Funkcja RDMA nad takim połączeniem ma kluczowe znaczenie dla zwiększenia skalowalności i wydajności obciążeń HPC i sztucznej inteligencji rozproszonych węzłów. Maszyny wirtualne serii H i N z obsługą infiniBand są połączone w drzewie tłuszczu bez blokowania o niskiej średnicy w celu zoptymalizowania i spójnej wydajności RDMA. Zobacz Włączanie aplikacji InfiniBand , aby dowiedzieć się więcej na temat konfigurowania aplikacji InfiniBand na maszynach wirtualnych z obsługą rozwiązania InfiniBand.

Interfejs przekazywania komunikatów

Obsługa serii HB i N serii HB z obsługą technologii SR-IOV obsługuje prawie wszystkie biblioteki i wersje MPI. Niektóre z najczęściej używanych bibliotek MPI to: Intel MPI, OpenMPI, HPC-X, MVAPICH2, MPICH, Platform MPII. Obsługiwane są wszystkie czasowniki zdalnego bezpośredniego dostępu do pamięci (RDMA). Zobacz Konfigurowanie interfejsu MPI , aby dowiedzieć się więcej o instalowaniu różnych obsługiwanych bibliotek MPI i ich optymalnej konfiguracji.

Rozpoczęcie pracy

Pierwszym krokiem jest wybranie optymalnego typu maszyny wirtualnej serii HB i N dla obciążenia na podstawie specyfikacji maszyny wirtualnej i funkcji RDMA. Po drugie skonfiguruj maszynę wirtualną, włączając funkcję InfiniBand. Istnieją różne metody, takie jak używanie zoptymalizowanych obrazów maszyn wirtualnych z zapiekanymi sterownikami; Aby uzyskać szczegółowe informacje , zobacz Optymalizacja dla systemu Linux i Włączanie rozwiązania InfiniBand . Po trzecie w przypadku obciążeń węzłów rozproszonych wybór i skonfigurowanie interfejsu MPI ma kluczowe znaczenie. Aby uzyskać szczegółowe informacje, zobacz Konfigurowanie interfejsu MPI . Po czwarte, aby uzyskać wydajność i skalowalność, optymalnie skonfiguruj obciążenia, postępując zgodnie ze wskazówkami specyficznymi dla rodziny maszyn wirtualnych, takimi jak omówienie serii HBv3 i omówienie serii HC.

Następne kroki