Seria "ND" podrodziny procesorów GPU z przyspieszoną serią rozmiarów maszyn wirtualnych

Artykuł
11/08/2024

Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows ✔️ — elastyczne zestawy ✔️ skalowania

Rodzina "ND" serii rozmiarów maszyn wirtualnych to jedno z wystąpień maszyn wirtualnych przyspieszanych przez procesor GPU platformy Azure. Są one przeznaczone do uczenia głębokiego, badań nad sztuczną inteligencją i zadań obliczeniowych o wysokiej wydajności, które korzystają z zaawansowanego przyspieszania procesora GPU. Wyposażone w procesory GPU FIRMY NVIDIA, maszyny wirtualne serii ND oferują wyspecjalizowane możliwości trenowania i wnioskowania złożonych modeli uczenia maszynowego, ułatwiając szybsze obliczenia i wydajną obsługę dużych zestawów danych. To sprawia, że są one szczególnie odpowiednie dla aplikacji akademickich i komercyjnych w zakresie opracowywania i symulacji sztucznej inteligencji, gdzie najnowocześniejsze technologie procesora GPU mają kluczowe znaczenie dla osiągnięcia szybkich i dokładnych wyników w przetwarzaniu sieci neuronowej i innych zadaniach intensywnie korzystających z obliczeń.

Obciążenia i przypadki użycia

Sztuczna inteligencja i uczenie głębokie: maszyny wirtualne rodziny ND są idealne do trenowania i wdrażania złożonych modeli uczenia głębokiego. Wyposażone w zaawansowane procesory GPU FIRMY NVIDIA zapewniają moc obliczeniową niezbędną do obsługi rozbudowanego trenowania sieci neuronowej z dużymi zestawami danych, co znacznie skraca czas trenowania.

Obliczenia o wysokiej wydajności (HPC): maszyny wirtualne rodziny ND są odpowiednie dla aplikacji HPC, które wymagają przyspieszenia procesora GPU. Pola takie jak badania naukowe, symulacje inżynieryjne (na przykład dynamika płynów obliczeniowych) i przetwarzanie genomiczne mogą korzystać z możliwości obliczeniowych z serii ND.

Seria w rodzinie

Seria ND V1

Maszyny wirtualne serii ND to nowy dodatek do rodziny procesorów GPU przeznaczonych dla obciążeń sztucznej inteligencji i uczenia głębokiego. Oferują one doskonałą wydajność szkolenia i wnioskowania. Wystąpienia ND są obsługiwane przez procesory GPU NVIDIA Tesla P40 i Intel Xeon E5-2690 v4 (Broadwell). Te wystąpienia zapewniają doskonałą wydajność dla operacji zmiennoprzecinkowych o pojedynczej precyzji, w przypadku obciążeń sztucznej inteligencji korzystających z zestawu narzędzi Microsoft Cognitive Toolkit, TensorFlow, Caffe i innych struktur. Seria ND oferuje także dużo pojemniejszą pamięć procesora GPU (24 GB) mieszczącą znacznie większe modele sieci neuronowych. Podobnie jak w przypadku serii NC, seria ND oferuje konfigurację z dodatkowymi małymi opóźnieniami, siecią o wysokiej przepływności za pośrednictwem funkcji RDMA i łącznością InfiniBand, dzięki czemu można uruchamiać zadania trenowania na dużą skalę obejmujące wiele procesorów GPU.

Wyświetl pełną stronę serii ND.

Element	Ilość ^{Liczba jednostek}	Specyfikacje ^{Identyfikator jednostki SKU, jednostki wydajności itp.}
Procesor	6 – 24 procesory wirtualne	Intel Xeon E5-2690 v4 (Broadwell) [x86-64]
Pamięć	112 - 448 GiB
Magazyn lokalny	1 Dysk	736 - 2948 GiB
Magazyn zdalny	12 — 32 Dyski	20000 – 80000 operacji we/wy na sekundę 200 – 800 MB/s
Sieć	4 – 8 kart sieciowych
Akceleratory	1 – 4 procesory GPU	Nvidia Tesla P40 GPU (24 GB)

Seria NDv2

Maszyna wirtualna serii NDv2 to nowy dodatek do rodziny procesorów GPU zaprojektowany pod kątem potrzeb najbardziej wymagających obciążeń sztucznej inteligencji przyspieszonej przez procesor GPU, uczenia maszynowego, symulacji i HPC.

NDv2 jest obsługiwany przez 8 procesorów GPU połączonych z nvlinkiem NVIDIA Tesla V100, z których każdy ma 32 GB pamięci procesora GPU. Każda maszyna wirtualna NDv2 ma również 40 rdzeni innych niż HyperThreaded Intel Xeon Platinum 8168 (Skylake) i 672 GiB pamięci systemowej.

Wystąpienia NDv2 zapewniają doskonałą wydajność obciążeń HPC i AI korzystających z jąder obliczeniowych zoptymalizowanych pod kątem procesora GPU CUDA oraz wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-box", takie jak TensorFlow, Pytorch, Caffe, RAPIDS i inne struktury.

Krytycznie NDv2 jest tworzony dla obciążeń intensywnie skalowanych w górę (wykorzystując 8 procesorów GPU na maszynę wirtualną) i skalowanych w poziomie (wykorzystujących wiele maszyn wirtualnych pracujących razem). Seria NDv2 obsługuje teraz sieć zaplecza 100 Gigabit InfiniBand EDR, podobną do dostępnej w serii HB maszyny wirtualnej HPC, aby umożliwić klastrowanie o wysokiej wydajności dla scenariuszy równoległych, w tym trenowanie rozproszone dla sztucznej inteligencji i uczenia maszynowego. Ta sieć zaplecza obsługuje wszystkie główne protokoły InfiniBand, w tym te stosowane przez biblioteki NCCL2 firmy NVIDIA, co umożliwia bezproblemowe klastrowanie procesorów GPU.

Wyświetl pełną stronę serii NDv2

Element	Ilość ^{Liczba jednostek}	Specyfikacje ^{Identyfikator jednostki SKU, jednostki wydajności itp.}
Procesor	40 procesorów wirtualnych	Intel Xeon Platinum 8168 (Skylake) [x86-64]
Pamięć	672 GiB
Magazyn lokalny	1 Dysk	2948 GiB
Magazyn zdalny	32 Dyski	80000 operacji we/wy na sekundę 800 MB/s
Sieć	8 kart sieciowych	24000 Mb/s
Akceleratory	Brak

seria ND_A100_v4

Maszyna wirtualna z serii ND A100 w wersji 4 to nowy flagowy dodatek do rodziny procesorów GPU platformy Azure. Te rozmiary są przeznaczone do trenowania wysokiej klasy uczenia głębokiego i ściśle powiązanych obciążeń HPC skalowanych w górę i skalowanych w poziomie.

Seria ND A100 v4 rozpoczyna się od jednej maszyny wirtualnej i ośmiu procesorów GPU NVIDIA Ampere A100 40 GB Tensor Core. Wdrożenia oparte na systemie ND A100 w wersji 4 mogą być skalowane w górę do tysięcy procesorów GPU z przepustowością połączenia wzajemnego na maszynę wirtualną o pojemności 1,6 TB/s. Każdy procesor GPU na maszynie wirtualnej jest dostarczany z własnym dedykowanym, niezależnym od topologii połączeniem NVIDIA Mellanox HDR InfiniBand o pojemności 200 GB/s. Te połączenia są automatycznie konfigurowane między maszynami wirtualnymi zajmującymi ten sam zestaw skalowania maszyn wirtualnych platformy Azure i obsługują funkcję RDMA bezpośredniego procesora GPU.

Każdy procesor GPU oferuje łączność NVLINK 3.0 na potrzeby komunikacji na maszynie wirtualnej z 96 fizycznymi rdzeniami procesora AMD Epyc™ 7V12 (Rzym) 96. generacji.

Te wystąpienia zapewniają doskonałą wydajność dla wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-the-box", takie jak TensorFlow, Pytorch, Caffe, RAPIDS i inne struktury. Ponadto połączenie infiniBand skalowane w poziomie obsługuje duży zestaw istniejących narzędzi sztucznej inteligencji i HPC opartych na bibliotekach komunikacyjnych NCCL2 firmy NVIDIA na potrzeby bezproblemowego klastrowania procesorów GPU.

Wyświetl pełną stronę serii ND_A100_v4.

Element	Ilość ^{Liczba jednostek}	Specyfikacje ^{Identyfikator jednostki SKU, jednostki wydajności itp.}
Procesor	96 procesorów wirtualnych	AMD EPYC 7V12 (Rzym) [x86-64]
Pamięć	900 GiB
Magazyn lokalny	1 Dysk	6000 GiB
Magazyn zdalny	32 Dyski	80000 operacji we/wy na sekundę 800 MB/s
Sieć	8 kart sieciowych	24000 Mb/s
Akceleratory	8 procesorów GPU	Procesor GPU Firmy Nvidia A100 (40 GB)

seria NDm_A100_v4

Maszyna wirtualna serii NDm A100 v4 to nowy flagowy dodatek do rodziny procesorów GPU platformy Azure. Te rozmiary są przeznaczone do trenowania wysokiej klasy uczenia głębokiego i ściśle powiązanych obciążeń HPC skalowanych w górę i skalowanych w poziomie.

Seria NDm A100 v4 rozpoczyna się od jednej maszyny wirtualnej i ośmiu procesorów GPU NVIDIA Ampere A100 80 GB Tensor Core. Wdrożenia nDm A100 w wersji 4 mogą skalować w górę do tysięcy procesorów GPU z 1,6 TB/s przepustowości połączenia międzyoperacyjnego na maszynę wirtualną. Każdy procesor GPU na maszynie wirtualnej jest dostarczany z własnym dedykowanym, niezależnym od topologii połączeniem NVIDIA Mellanox HDR InfiniBand o pojemności 200 GB/s. Te połączenia są automatycznie konfigurowane między maszynami wirtualnymi zajmującymi ten sam zestaw skalowania maszyn wirtualnych platformy Azure i obsługują funkcję RDMA bezpośredniego procesora GPU.

Każdy procesor GPU oferuje łączność NVLINK 3.0 na potrzeby komunikacji na maszynie wirtualnej z 96 fizycznymi rdzeniami procesora AMD Epyc™ 7V12 (Rzym) 96. generacji.

Wyświetl pełną stronę serii NDm_A100_v4.

Element	Ilość ^{Liczba jednostek}	Specyfikacje ^{Identyfikator jednostki SKU, jednostki wydajności itp.}
Procesor	96 procesorów wirtualnych	AMD EPYC 7V12 (Rzym) [x86-64]
Pamięć	1900 GiB
Magazyn lokalny	1 Dysk	6400 GiB
Magazyn zdalny	32 Dyski	80000 operacji we/wy na sekundę 800 MB/s
Sieć	8 kart sieciowych	24000 Mb/s
Akceleratory	8 procesorów GPU	Procesor GPU Firmy Nvidia A100 (80 GB)

seria ND_H100_v5

Maszyna wirtualna z serii ND H100 v5 to nowy flagowy dodatek do rodziny procesorów GPU platformy Azure. Ta seria jest przeznaczona do trenowania wysokiej klasy uczenia głębokiego i ściśle powiązanego ze skalowaniem w górę i skalowalnego w poziomie obciążeń sztucznej inteligencji i HPC.

Seria ND H100 v5 rozpoczyna się od jednej maszyny wirtualnej i ośmiu procesorów GPU NVIDIA H100 Tensor Core. Wdrożenia oparte na ND H100 v5 mogą być skalowane w górę do tysięcy procesorów GPU z 3,2 Tb/s przepustowości połączenia międzylokacyjnej na maszynę wirtualną. Każdy procesor GPU na maszynie wirtualnej jest dostarczany z własnym dedykowanym, niezależnym od topologii połączeniem NVIDIA Quantum-2 CX7 InfiniBand o pojemności 400 Gb/s. Te połączenia są automatycznie konfigurowane między maszynami wirtualnymi zajmującymi ten sam zestaw skalowania maszyn wirtualnych i obsługują funkcję RDMA bezpośredniego procesora GPU.

Każdy procesor GPU oferuje łączność NVLINK 4.0 na potrzeby komunikacji na maszynie wirtualnej, a wystąpienie ma 96 rdzeni procesora Intel Xeon Scalable 96 generacji.

Te wystąpienia zapewniają doskonałą wydajność dla wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-the-box", takie jak TensorFlow, Pytorch, Caffe, RAPIDS i inne struktury. Ponadto połączenie infiniBand skalowane w poziomie obsługuje duży zestaw istniejących narzędzi sztucznej inteligencji i HPC opartych na bibliotekach komunikacyjnych NCCL firmy NVIDIA na potrzeby bezproblemowego klastrowania procesorów GPU.

Wyświetl pełną stronę serii ND_H100_v5.

Element	Ilość ^{Liczba jednostek}	Specyfikacje ^{Identyfikator jednostki SKU, jednostki wydajności itp.}
Procesor	96 procesorów wirtualnych	Intel Xeon (Sapphire Rapids) [x86-64]
Pamięć	1900 GiB
Magazyn lokalny	1 Dysk	28000 GiB
Magazyn zdalny	32Disks
Sieć	8 kart sieciowych
Akceleratory	8 procesorów GPU	Procesor GPU Firmy Nvidia H100 (80 GB)

seria ND_MI300X_v5

Maszyna wirtualna z serii ND MI300X v5 to nowy flagowy dodatek do rodziny procesorów GPU platformy Azure. Został zaprojektowany na potrzeby trenowania wysokiej klasy uczenia głębokiego i ściśle powiązanego ze skalowaniem w górę i skalowalnego w poziomie obciążeń sztucznej inteligencji i HPC.

Maszyna wirtualna z serii ND MI300X v5 rozpoczyna się od ośmiu procesorów GPU AMD Instinct MI300 i dwóch czwartych procesorów Intel Xeon Scalable 96 rdzeni fizycznych. Każdy procesor GPU na maszynie wirtualnej jest następnie połączony ze sobą za pośrednictwem linków 4th-Gen AMD Infinity Fabric z przepustowością 128 GB/s na procesor GPU i 896 GB/s zagregowanej przepustowości.

Wdrożenia oparte na protokole ND MI300X w wersji 5 mogą być skalowane w górę do tysięcy procesorów GPU z przepustowością połączenia wzajemnego na maszynę wirtualną o pojemności 3,2 TB/s. Każdy procesor GPU na maszynie wirtualnej jest dostarczany z własnym dedykowanym, niezależnym od topologii połączeniem NVIDIA Quantum-2 CX7 InfiniBand o pojemności 400 Gb/s. Te połączenia są automatycznie konfigurowane między maszynami wirtualnymi zajmującymi ten sam zestaw skalowania maszyn wirtualnych i obsługują funkcję GPUDirect RDMA.

Te wystąpienia zapewniają doskonałą wydajność dla wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-the-box", takie jak TensorFlow, Pytorch i inne struktury. Ponadto połączenie infiniBand skalowane w poziomie obsługuje duży zestaw istniejących narzędzi sztucznej inteligencji i HPC opartych na bibliotece ROCm Communication Collectives Library (RCCL) firmy AMD w celu bezproblemowego klastrowania procesorów GPU.

Wyświetl pełną stronę serii ND_MI300X_v5.

Element	Ilość ^{Liczba jednostek}	Specyfikacje ^{Identyfikator jednostki SKU, jednostki wydajności itp.}
Procesor	96 procesorów wirtualnych	Intel Xeon (Sapphire Rapids) [x86-64]
Pamięć	1850 GiB
Magazyn lokalny	Dysk tymczasowy 1 8 dysków NVMe	Dysk tymczasowy 1000 GiB Dyski NVMe GiB 28000
Magazyn zdalny	32 Dyski	80000 operacji we/wy na sekundę 1200 MB/s
Sieć	8 kart sieciowych
Akceleratory	8 procesorów GPU	PROCESOR GPU AMD Instinct MI300X (192 GB)

Seria rodziny ND poprzedniej generacji

Aby uzyskać informacje o starszych rozmiarach, zobacz poprzednie rozmiary generacji.

Inne informacje o rozmiarze

Lista wszystkich dostępnych rozmiarów: rozmiary

Kalkulator cen: Kalkulator cen

Informacje o typach dysków: Typy dysków

Następne kroki

Dowiedz się więcej o tym, jak jednostki obliczeniowe platformy Azure (ACU) mogą ułatwić porównanie wydajności obliczeń w jednostkach SKU platformy Azure.

Zapoznaj się z usługą Azure Dedicated Hosts dla serwerów fizycznych, które mogą hostować co najmniej jedną maszynę wirtualną przypisaną do jednej subskrypcji platformy Azure.

Dowiedz się, jak monitorować maszyny wirtualne platformy Azure.

Udostępnij za pośrednictwem