Obliczenia o wysokiej wydajności na maszynach wirtualnych z obsługą technologii InfiniBand z serii HB i N
Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows ✔️ — elastyczne zestawy ✔️ skalowania
Maszyny wirtualne z serii H i N z obsługą rozwiązania InfiniBand platformy Azure zostały zaprojektowane w celu zapewnienia wydajności klasy przywództwa, skalowalności interfejsu MPI (Message Passing Interface) i wydajności kosztów dla różnych rzeczywistych obciążeń HPC i sztucznej inteligencji. Te maszyny wirtualne zoptymalizowane pod kątem obliczeń o wysokiej wydajności (HPC) służą do rozwiązywania niektórych z najbardziej wymagających obliczeń problemów w nauce i inżynierii, takich jak: dynamika płynów, modelowanie ziemi, symulacje pogody itp.
W tych artykułach opisano, jak rozpocząć pracę z maszynami wirtualnymi z serii H i N z obsługą rozwiązania InfiniBand na platformie Azure, a także optymalną konfiguracją obciążeń HPC i AI na maszynach wirtualnych w celu zapewnienia skalowalności.
Funkcje i możliwości
Maszyny wirtualne z serii HB i N z obsługą rozwiązania InfiniBand zostały zaprojektowane w celu zapewnienia najlepszej wydajności HPC, skalowalności MPI i wydajności kosztów obciążeń HPC. Zobacz Maszyny wirtualne serii HB i N, aby dowiedzieć się więcej o funkcjach i możliwościach maszyn wirtualnych.
RDMA i InfiniBand
Maszyny wirtualne z serii HB i N obsługujące funkcję RDMA komunikują się z siecią InfiniBand o małym opóźnieniu i wysokiej przepustowości. Funkcja RDMA za pośrednictwem takiego połączenia ma kluczowe znaczenie dla zwiększenia skalowalności i wydajności obciążeń HPC i sztucznej inteligencji rozproszonych węzłów. Maszyny wirtualne z serii H i N z włączoną funkcją InfiniBand są połączone w nieblokowanym drzewie tłuszczu o niskiej średnicy w celu zoptymalizowania i spójnej wydajności RDMA. Zobacz Włączanie aplikacji InfiniBand , aby dowiedzieć się więcej na temat konfigurowania aplikacji InfiniBand na maszynach wirtualnych z obsługą protokołu InfiniBand.
Interfejs przekazywania komunikatów
Obsługa serii HB i N serii HB z obsługą sr-IOV prawie wszystkich bibliotek i wersji MPI. Niektóre z najczęściej używanych bibliotek MPI to: Intel MPI, OpenMPI, HPC-X, MVAPICH2, MPICH, Platform MPII. Obsługiwane są wszystkie czasowniki dostępu do pamięci zdalnej (RDMA). Zobacz Konfigurowanie interfejsu MPI , aby dowiedzieć się więcej na temat instalowania różnych obsługiwanych bibliotek MPI i ich optymalnej konfiguracji.
Rozpocznij
Pierwszym krokiem jest wybranie optymalnego typu maszyny wirtualnej serii HB i N dla obciążenia na podstawie specyfikacji maszyny wirtualnej i funkcji RDMA. Po drugie skonfiguruj maszynę wirtualną, włączając funkcję InfiniBand. Istnieją różne metody, takie jak używanie zoptymalizowanych obrazów maszyn wirtualnych ze sterownikami, które są pieczone; Aby uzyskać szczegółowe informacje, zobacz Optymalizacja dla systemu Linux i Włączanie rozwiązania InfiniBand . Po trzecie, w przypadku obciążeń węzłów rozproszonych wybór i skonfigurowanie interfejsu MPI ma kluczowe znaczenie. Aby uzyskać szczegółowe informacje, zobacz Konfigurowanie interfejsu MPI . Po czwarte, aby uzyskać wydajność i skalowalność, optymalnie skonfiguruj obciążenia, postępując zgodnie ze wskazówkami specyficznymi dla rodziny maszyn wirtualnych, takimi jak omówienie serii HBv3 i omówienie serii HC.
Następne kroki
- Dowiedz się więcej na temat konfigurowania i optymalizowania maszyn wirtualnych z serii HB i N z obsługą technologii InfiniBand.
- Zapoznaj się z omówieniem serii HBv3 i omówieniem serii HC, aby dowiedzieć się więcej o optymalnym konfigurowaniu obciążeń pod kątem wydajności i skalowalności.
- Przeczytaj o najnowszych ogłoszeniach, przykładach obciążeń HPC i wynikach wydajności na blogach społeczności technicznej usługi Azure Compute.
- Przetestuj swoją wiedzę przy użyciu modułu szkoleniowego na temat optymalizowania aplikacji HPC na platformie Azure.
- Aby uzyskać widok architektury wyższego poziomu na potrzeby uruchamiania obciążeń HPC, zobacz Obliczenia o wysokiej wydajności (HPC) na platformie Azure.