ND A100 v4-series

Platí pro: ✔️ Flexibilní škálovací sady virtuálních ✔️ počítačů ✔️ s Linuxem – Jednotné škálovací sady

Virtuální počítač ND A100 v4 series je novým vlajkovým doplňkem řady Azure GPU. Je navržený pro vysoce kvalitní trénování hlubokého učení a úzce propojené vertikální navýšení a horizontální navýšení kapacity úloh HPC.

Řada ND A100 v4 začíná s jedním virtuálním počítačem a osmi grafickými procesory NVIDIA Ampere A100 40GB Tensor Core. Nasazení založená na ND A100 v4 se můžou škálovat až na tisíce gpu s 1,6 TB/s propojovací šířky pásma na virtuální počítač. Každá grafická karta v rámci virtuálního počítače má vlastní vyhrazené připojení InfiniBand s 200 GB/s NVIDIA Mellanox HDR. Tato připojení se automaticky konfigurují mezi virtuálními počítači, které zabírají stejnou škálovací sadu virtuálních počítačů, a podporují GPUDirect RDMA.

Každý GPU obsahuje připojení NVLINK 3.0 pro komunikaci v rámci virtuálního počítače a instance je podporována 96 fyzickými procesory AMD Epyc™ 7V12 (Rome) 2. generace.

Tyto instance poskytují vynikající výkon pro mnoho nástrojů AI, ML a analytických nástrojů, které podporují akceleraci GPU", jako jsou TensorFlow, Pytorch, Caffe, RAPIDS a další architektury. Horizontální propojení InfiniBand je navíc podporováno velkou sadou stávajících nástrojů AI a HPC, které jsou postavené na komunikačních knihovnách NVIDIA NCCL2 pro bezproblémový clustering gpu.

Důležité

Pokud chcete začít pracovat s virtuálními počítači ND A100 v4, přečtěte si téma Konfigurace a optimalizace úloh PROSTŘEDÍ HPC , kde najdete kroky, včetně konfigurace ovladačů a sítě. Z důvodu zvýšené nároky na vstupně-výstupní operace paměti GPU vyžaduje ND A100 v4 použití virtuálních počítačů 2. generace a imagí z marketplace. Důrazně doporučujeme používat image Prostředí Azure HPC. Podporované jsou image Azure HPC Ubuntu 18.04, 20.04 a Azure HPC CentOS 7.9.


Premium Storage: Podporováno
Premium Storage ukládání do mezipaměti: Podporováno
Disky Úrovně Ultra: Podporované (Další informace o dostupnosti, využití a výkonu)
Migrace za provozu: Nepodporuje se
Aktualizace zachování paměti: Nepodporuje se
Podpora generování virtuálních počítačů: Generace 2
Akcelerované síťové služby: Podporované
Dočasné disky s operačním systémem: Podporované
InfiniBand: Podporováno, GPUDirect RDMA, 8 x 200 Gigabit HDR
NVIDIA NVLink Interconnect: Podporováno
Vnořená virtualizace: Nepodporuje se

Řada ND A100 v4 podporuje následující verze jádra:
CentOS 7.9 HPC: 3.10.0-1160.24.1.el7.x86_64
Ubuntu 18.04: 5.4.0-1043-azure
Ubuntu 20.04: 5.4.0-1046-azure

Velikost Virtuální procesory Paměť: GiB Dočasné úložiště (SSD): GiB GPU Paměť GPU: GiB Max. datových disků Maximální propustnost disku bez mezipaměti: IOPS / MB/s Maximální šířka pásma sítě Maximální počet síťových karet
Standard_ND96asr_v4 96 900 6000 8 A100 40 GB GPU (NVLink 3.0) 40 32 80,000 / 800 24 000 Mb/s 8

Definice tabulky velikostí

  • Kapacita úložiště je v jednotkách GiB, tj. 1024^3 bajtů. Když porovnáte disky měřené v GB (1 000^3 bajtů) s disky měřenými v GiB (1024^3), mějte na paměti, že čísla kapacity uvedená v GiB můžou být menší. Například 1023 GiB = 1098,4 GB.

  • Propustnost disku se měří v počtu V/V operací za sekundu (IOPS) a v MB/s, kde 1 MB/s = 10^6 bajtů/s.

  • Disky pro ukládání dat můžou fungovat v režimu s mezipamětí, nebo bez ní. Pro diskové operace s mezipamětí je možné nastavit mezipaměť na hostiteli jen na čtení nebo na čtení i zápis. Pro diskové operace bez mezipaměti je mezipaměť na hostiteli nastavená na žádná.

  • Informace o tom, jak dosáhnout nejlepšího výkonu úložiště pro virtuální počítače, najdete v tématu Výkon virtuálních počítačů a disků.

  • Očekávaná šířka pásma sítě je maximální agregovaná šířka pásma přidělená jednotlivým typům virtuálních počítačů napříč všemi síťovými kartami pro všechny cíle. Další informace najdete v tématu Šířka pásma sítě virtuálního počítače.

    Horní limity nejsou zaručené. Omezení nabízejí pokyny pro výběr správného typu virtuálního počítače pro zamýšlenou aplikaci. Skutečný výkon sítě bude záviset na několika faktorech, včetně zahlcení sítě, zatížení aplikací a nastavení sítě. Informace o optimalizaci propustnosti sítě najdete v tématu Optimalizace propustnosti sítě pro virtuální počítače Azure. Pokud chcete dosáhnout očekávaného výkonu sítě v Linuxu nebo Windows, možná budete muset vybrat konkrétní verzi nebo optimalizovat virtuální počítač. Další informace najdete v tématu Testování šířky pásma a propustnosti (NTTTCP).

Další velikosti a informace

Cenová kalkulačka: Cenová kalkulačka

Další informace o typech disků najdete v tématu Jaké typy disků jsou k dispozici v Azure?

Další kroky

Přečtěte si další informace o tom, jak vám výpočetní jednotky Azure (ACU) můžou pomoct s porovnáním výpočetního výkonu napříč skladovými jednotkami Azure.