NDm A100 v4-series

Upozornění

Tento článek odkazuje na CentOS, linuxovou distribuci, která se blíží stavu Konec životnosti (EOL). Zvažte své použití a odpovídajícím způsobem naplánujte. Další informace najdete v doprovodných materiálech CentOS End Of Life.

Platí pro: ✔️ Virtuální počítače s Windows s Linuxem ✔️ ✔️ – Flexibilní škálovací sady Uniform Scale Sets ✔️

Virtuální počítač řady NDm A100 v4 je novým vlajkovým doplňkem řady Azure GPU. Je navržená pro vysoce komplexní hloubkové Učení trénování a úzce propojené úlohy HPC s vertikálním navýšením kapacity a horizontálním navýšením kapacity.

Řada NDm A100 v4 začíná jedním virtuálním počítačem a osmi grafickými procesory NVIDIA Ampere A100 80GB Tensor Core GPU. Nasazení založená na NDm A100 v4 můžou vertikálně navýšit kapacitu až na tisíce GPU s šířkou pásma 1,6 TB/s propojování na virtuální počítač. Každý GPU v rámci virtuálního počítače má vlastní vyhrazené topologie nezávislé na 200 GB/s NVIDIA Mellanox HDR InfiniBand. Tato připojení se mezi virtuálními počítači, které zabírají stejnou škálovací sadu virtuálních počítačů, automaticky konfigurují a podporují RDMA s GPUDirect.

Každý GPU nabízí připojení NVLINK 3.0 pro komunikaci v rámci virtuálního počítače a instance je podporována 96 fyzickými jádry procesoru AMD Epyc™ 7V12 (Řím).

Tyto instance poskytují vynikající výkon pro mnoho nástrojů pro AI, ML a analýzy, které podporují akceleraci GPU", jako jsou TensorFlow, Pytorch, Caffe, RAPIDS a další architektury. Kromě toho je propojení InfiniBand se škálováním na více systémů podporováno velkou sadou stávajících nástrojů AI a HPC, které jsou založené na komunikačních knihovnách NCCL2 společnosti NVIDIA pro bezproblémové clusterování gpu.

Důležité

Pokud chcete začít pracovat s virtuálními počítači NDm A100 v4, projděte si postup konfigurace a optimalizace úloh HPC, včetně konfigurace ovladače a sítě. Kvůli zvýšenému využití vstupně-výstupních operací paměti GPU vyžaduje NDm A100 v4 použití virtuálních počítačů generace 2 a imagí z marketplace. Image Azure HPC se důrazně doporučují. Podporují se image Azure HPC Ubuntu 18.04, 20.04 a Azure HPC CentOS 7.9.


Premium Storage: Podporováno
Ukládání do mezipaměti Premium Storage: Podporováno
Disky Úrovně Ultra: Podporované (další informace o dostupnosti, využití a výkonu)
Migrace za provozu: Nepodporuje se
Aktualizace zachování paměti: Nepodporuje se
Podpora generování virtuálních počítačů: Generace 2
Akcelerované síťové služby: Podporováno
Dočasné disky s operačním systémem: Podporované
InfiniBand: Podporováno, GPUDirect RDMA, 8 x 200 Gigabit HDR
Nvidia NVLink Interconnect: Podporováno
Vnořená virtualizace: Nepodporuje se

Řada NDm A100 v4 podporuje následující verze jádra:
CentOS 7.9 HPC: 3.10.0-1160.24.1.el7.x86_64
Ubuntu 18.04: 5.4.0-1043-azure
Ubuntu 20.04: 5.4.0-1046-azure

Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (SSD): GiB GPU Paměť GPU: GiB Max. datových disků Maximální propustnost disku bez mezipaměti: IOPS / MB/s Maximální šířka pásma sítě Maximální počet síťových karet
Standard_ND96amsr_A100_v4 96 1900 6400 8 A100 80 GB GPU (NVLink 3.0) 80 32 80,000 / 800 24 000 Mb/s 8

Definice tabulky velikostí

  • Kapacita úložiště je v jednotkách GiB, tj. 1024^3 bajtů. Při porovnávání disků měřených v GB (1000^3 bajtů) s disky měřenými v GiB (1024^3) nezapomeňte, že čísla kapacity uvedená v GiB mohou být menší. Například 1023 GiB = 1098,4 GB.

  • Propustnost disku se měří v počtu V/V operací za sekundu (IOPS) a v MB/s, kde 1 MB/s = 10^6 bajtů/s.

  • Disky pro ukládání dat můžou fungovat v režimu s mezipamětí, nebo bez ní. Pro diskové operace s mezipamětí je možné nastavit mezipaměť na hostiteli jen na čtení nebo na čtení i zápis. Pro diskové operace bez mezipaměti je mezipaměť na hostiteli nastavená na žádná.

  • Informace o tom, jak získat nejlepší výkon úložiště pro virtuální počítače, najdete v tématu Výkon virtuálního počítače a disku.

  • Očekávaná šířka pásma sítě je maximální agregovaná šířka pásma přidělená jednotlivým typům virtuálních počítačů pro všechny síťové karty pro všechny cíle. Další informace najdete v tématu Šířka pásma sítě virtuálních počítačů.

    Horní limity nejsou zaručeny. Omezení nabízejí pokyny pro výběr správného typu virtuálního počítače pro zamýšlenou aplikaci. Skutečný výkon sítě bude záviset na několika faktorech, včetně zahlcení sítě, zatížení aplikace a nastavení sítě. Informace o optimalizaci propustnosti sítě najdete v tématu Optimalizace propustnosti sítě pro virtuální počítače Azure. Abyste dosáhli očekávaného výkonu sítě v Linuxu nebo Windows, možná budete muset vybrat konkrétní verzi nebo optimalizovat virtuální počítač. Další informace najdete v tématu Testování šířky pásma a propustnosti (NTTTCP).

Další velikosti a informace

Cenová kalkulačka: Cenová kalkulačka

Další informace otypech

Další kroky

Přečtěte si další informace o tom, jak vám výpočetní jednotky Azure (ACU) můžou pomoct porovnat výkon výpočetních prostředků napříč skladovými jednotkami Azure.