NDm A100 v4-sorozat

Figyelemfelhívás

Ez a cikk a CentOS-ra, egy olyan Linux-disztribúcióra hivatkozik, amely közel áll az élettartam (EOL) állapotához. Fontolja meg a használatát, és ennek megfelelően tervezze meg. További információ: CentOS End Of Life útmutató.

A következőkre vonatkozik: ✔️ Linux rendszerű virtuális gépek ✔️ Windows rendszerű virtuális gépek Rugalmas méretezési ✔️ csoportok ✔️ Egységes méretezési csoportok

Az NDm A100 v4 sorozatú virtuális gép (VM) az Azure GPU-család új zászlóshajója. A csúcskategóriás mély Tanulás betanításhoz, valamint a szorosan összekapcsolt vertikális felskálázáshoz és a HPC-számítási feladatok vertikális felskálázásához lett kialakítva.

Az NDm A100 v4 sorozat egyetlen virtuális géppel és nyolc NVIDIA Ampere A100 80 GB-os Tensor Core GPU-val kezdődik. Az NDm A100 v4-alapú üzemelő példányok akár több ezer GPU-ra is felskálázhatók, virtuális gépenként 1,6 TB/s kapcsolati sávszélességgel. A virtuális gépen belül minden GPU saját dedikált, topológia-agnosztikus 200 GB/s NVIDIA Mellanox HDR InfiniBand-kapcsolattal rendelkezik. Ezek a kapcsolatok automatikusan konfigurálva vannak az azonos virtuálisgép-méretezési csoportot használó virtuális gépek között, és támogatják a GPUDirect RDMA-t.

Minden GPU NVLINK 3.0 kapcsolatot biztosít a virtuális gépen belüli kommunikációhoz, a példányt pedig 96 fizikai 2. generációs AMD Epyc™ 7V12 (Róma) CPU-magok biztosítják.

Ezek a példányok kiváló teljesítményt nyújtanak számos olyan AI-, ML- és elemzési eszközhöz, amelyek támogatják a GPU-gyorsítást a "házon kívül", például a TensorFlow, a Pytorch, a Caffe, a RAPIDS és más keretrendszerek esetében. Emellett a kibővített InfiniBand-összekapcsolást számos meglévő AI- és HPC-eszköz támogatja, amelyek az NVIDIA NCCL2 kommunikációs kódtáraira épülnek a GPU-k zökkenőmentes fürtözése érdekében.

Fontos

Az NDm A100 v4 virtuális gépek használatának megkezdéséhez tekintse meg a HPC számítási feladatok konfigurációját és optimalizálását az illesztőprogramot és a hálózati konfigurációt is beleértve. A GPU-memória I/O-terhelésének növekedése miatt az NDm A100 v4 használatához 2. generációs virtuális gépek és marketplace-rendszerképek szükségesek. Erősen ajánlott az Azure HPC-rendszerképek használata. Az Azure HPC Ubuntu 18.04, 20.04 és Azure HPC CentOS 7.9 rendszerképek támogatottak.


Premium Storage: Támogatott
Premium Storage-gyorsítótárazás: Támogatott
Ultralemezek: Támogatott (További információ a rendelkezésre állásról, a használatról és a teljesítményről)
Élő áttelepítés: nem támogatott
Memóriamegőrző Frissítések: Nem támogatott
Virtuális gép generációjának támogatása: 2. generáció
Gyorsított hálózatkezelés: Támogatott
Rövid élettartamú operációsrendszer-lemezek: támogatott
InfiniBand: Támogatott, GPUDirect RDMA, 8 x 200 Gigabit HDR
Nvidia NVLink Interconnect: Támogatott
Beágyazott virtualizálás: nem támogatott

Az NDm A100 v4 sorozat a következő kernelverziókat támogatja:
CentOS 7.9 HPC: 3.10.0-1160.24.1.el7.x86_64
Ubuntu 18.04: 5.4.0-1043-azure
Ubuntu 20.04: 5.4.0-1046-azure

Méret vCPU Memória: GiB Temp Storage (SSD): GiB GPU GPU-memória: GiB Adatlemezek max. száma Max. gyorsítótárazás nélküli lemezteljesítmény: IOPS/MBps Hálózati sávszélesség maximális kihasználtság Hálózati adapterek maximális száma
Standard_ND96amsr_A100_v4 96 1900 6400 8 A100 80 GB GPU (NVLink 3.0) 80 32 80,000 / 800 24 000 Mb/s 8

Mérettábla definíciói

  • A tárolókapacitás mértékegysége GiB (gibibájt = 1024^3 bájt). Ha a GB-ban mért lemezeket (1000^3 bájt) összehasonlítja a GiB-ben mért lemezekkel (1024^3), ne feledje, hogy a GiB-ben megadott kapacitásszámok kisebbnek tűnhetnek. Például 1023 GiB = 1098,4 GB.

  • A lemezteljesítmény másodpercenkénti bemeneti/kimeneti műveletek (IOPS) mennyiségeként van kifejezve, valamint MBps-ben, ahol 1 MBps = 10^6 bájt/másodperc.

  • Az adatlemezek gyorsítótárazott és gyorsítótárazás nélküli módban üzemelhetnek. Gyorsítótárazott adatlemezüzem esetében a gazdagép gyorsítótáras üzemmódja ReadOnly (Csak olvasás) vagy ReadWrite (Írás és olvasás) beállításra van konfigurálva. Gyorsítótárazás nélküli adatlemezüzem esetében a gazdagép gyorsítótáras üzemmódja None (Nincs) beállításra van konfigurálva.

  • A virtuális gépek legjobb tárolási teljesítményének megismeréséhez tekintse meg a virtuális gépek és a lemezek teljesítményét.

  • A várt hálózati sávszélesség a virtuálisgép-típusonként lefoglalt maximális összesített sávszélesség az összes hálózati adapteren az összes célhelyen. További információ: Virtuális gépek hálózati sávszélessége.

    A felső korlátok nem garantáltak. A korlátok útmutatást nyújtanak a megfelelő virtuálisgép-típus kiválasztásához a kívánt alkalmazáshoz. A tényleges hálózati teljesítmény számos tényezőtől függ, például a hálózati torlódástól, az alkalmazások terhelésétől és a hálózati beállításoktól. A hálózati átviteli sebesség optimalizálásáról további információt az Azure-beli virtuális gépek hálózati átviteli sebességének optimalizálása című témakörben talál. A várt hálózati teljesítmény Linux vagy Windows rendszeren való eléréséhez előfordulhat, hogy ki kell választania egy adott verziót, vagy optimalizálnia kell a virtuális gépet. További információ: Sávszélesség/átviteli sebesség tesztelése (NTTTCP).

Egyéb méretek és információk

Díjkalkulátor: Tarifakalkulátor

További információ a lemeztípusokról: Milyen lemeztípusok érhetők el az Azure-ban?

Következő lépések

További információ arról, hogyan segíthet az Azure számítási egységek (ACU) az Azure SKU-k számítási teljesítményének összehasonlításában.