Der virtuelle Computer der ND-GB200-v6-Serie (VM) ist ein Flaggschiff der Azure GPU-Familie und bietet eine unerreichte Leistung für Deep Learning-Schulungen, generative KI- und HPC-Workloads. Diese VMs nutzen die NVIDIA GB200 Tensor Core GPUs, die auf der Blackwell-Architektur basieren, die erhebliche Fortschritte bei Rechenleistung, Speicherbandbreite und Skalierbarkeit über frühere Generationen bietet.
Jede VM ND-GB200-v6 wird von zwei NVIDIA Grace CPUs und vier NVIDIA Blackwell GPUs unterstützt. Die GPUs sind über NVLink der fünften Generation miteinander verbunden und bieten insgesamt 4× 1,8 TB/s NVLink-Bandbreite pro VM. Diese robuste Scale-up-Verbindung ermöglicht eine nahtlose, schnelle Kommunikation zwischen GPUs innerhalb der VM. Darüber hinaus bietet die VM ein skaliertes Backend-Netzwerk mit 4× 400 GB/s NVIDIA Quantum-2 CX7 InfiniBand-Verbindungen pro VM, was einen hohen Durchsatz und eine niedrige Latenz bei der Kommunikation beim Verbinden mehrerer VMs sicherstellt.
NVIDIA GB200 NVL72 verbindet bis zu 72 GPUs pro Rack, sodass das System als einzelner Computer ausgeführt werden kann. Dieses 72-GPU-Rack-Skalierungssystem besteht aus Gruppen von 18 ND GB200 v6 VMs, die bis zu 1,4 Exa-FLOPS FP4-Tensor-Core-Durchsatz, 13,5 TB gemeinsam genutzten Hochgeschwindigkeits-Arbeitsspeicher, 130 TB/s NVLINK-Bandbreite über Querschnitt und 28,8 Tb/s Scale-Out-Netzwerkleistung bereitstellen.
Mit 128 vCPUs pro VM, die das Gesamtsystem unterstützen, ist die Architektur optimiert, um Workloads und Speicheranforderungen für KI- und wissenschaftliche Anwendungen effizient zu verteilen. Dieses Design ermöglicht eine nahtlose Multi-GPU-Skalierung und eine robuste Handhabung großer Modelle.
Diese Instanzen bieten eine erstklassige Leistung für AI-, ML- und Analyseworkloads mit out-of-the-box-Unterstützung für Frameworks wie TensorFlow, PyTorch, JAX, RAPIDS und vieles mehr. Die skalierte InfiniBand-Verbindung ist für vorhandene KI- und HPC-Tools optimiert, die auf DEN NCCL-Kommunikationsbibliotheken von NVIDIA basieren und eine effiziente verteilte Computerverarbeitung über große Cluster hinweg gewährleisten.
Hostspezifikationen
Teil |
Menge Anzahl Einheiten |
Spezifikationen SKU-ID, Leistungseinheiten usw. |
Prozessor |
128 vCPUs |
Nvidia Grace CPU |
Gedächtnis |
900 GB VM |
LPDDR |
Lokaler Speicher |
4 Datenträger |
16 TB NVME Direkt |
Remotespeicher |
16 Datenträger |
80000 IOPS/1200 MBps |
Netzwerk |
1 NIC |
160Gb/s Ethernet |
Beschleuniger |
4 GPUs |
Nvidia Blackwell GPU (192 GB) |
Featureunterstützung
Storage Premium: Unterstützt
Premium-Storage-Caching: Unterstützt
Live-Migration: Nicht unterstützt
Updates mit Speicherbeibehaltung: Nicht unterstützt
VMs der 2. Generation: unterstützt
VMs der 1. Generation: nicht unterstützt
Beschleunigter Netzwerkbetrieb: Unterstützt
Kurzlebiger Betriebssystemdatenträger: unterstützt
Geschachtelte Virtualisierung: Nicht unterstützt
Größen der Serie
vCPUs (Anzahl) und Arbeitsspeicher je nach Größe
Name der Größe |
vCPUs (Anzahl) |
Arbeitsspeicher (GB) |
Standard_ND128isr_NDR_GB200_v6 |
128 |
900 |
VM Basics-Ressourcen
Lokale temporäre Speicherinformationen für jede Größe
Name der Größe |
Max. temporäre Speicherdatenträger (Menge) |
Größe der temporären Festplatte (TB) |
Standard_ND128isr_NDR_GB200_v6 |
4 |
16 |
Speicherressourcen
Tabellendefinitionen
- Die Geschwindigkeit des temporären Speichers unterscheidet sich häufig zwischen Random-Read- (Lesevorgänge) und Random-Write-Operationen (Schreibvorgänge). RR-Vorgänge sind in der Regel schneller als RW-Vorgänge. Die RW-Geschwindigkeit ist in der Regel langsamer als die RR-Geschwindigkeit bei Serien, für die nur der RR-Geschwindigkeitswert aufgeführt ist.
- Speicherkapazität wird in GiB-Einheiten oder 1.024^3 Bytes angezeigt. Beachten Sie beim Vergleich von in GB (1000^3 Bytes) gemessenen Datenträgern mit in GiB (1024^3) gemessenen Datenträgern, dass die in GiB angegebenen Kapazitätszahlen kleiner erscheinen können. Beispiel: 1.023 GiB = 1.098,4 GB.
- Der Datenträgerdurchsatz wird in E/A-Vorgängen pro Sekunde (Input/Output Operations Per Second, IOPS) und MB/s gemessen, wobei MB/s = 10^6 Bytes/Sekunde beträgt.
- Weitere Informationen, wie Sie die beste Speicherleistung für Ihre VMs erzielen können, finden Sie unter Leistung von virtuellen Computern und Datenträgern.
Remotespeicherinformationen (nicht zwischengespeichert) für jede Größe
Name der Größe |
Max. Fernspeicherfestplatten (Anzahl) |
Nicht zwischengespeicherte Datenträger-IOPS |
Datenträgergeschwindigkeit ohne Zwischenspeicherung (MBit/s) |
Standard_ND128isr_NDR_GB200_v6 |
316 |
80.000 |
1.200 |
Speicherressourcen
Tabellendefinitionen
- Einige Größen unterstützen Burstfunktion, um die Datenträgerleistung vorübergehend zu erhöhen. Spitzengeschwindigkeiten können bis zu 30 Minuten lang aufrechterhalten werden.
- Spezieller Speicher bezieht sich entweder auf den Ultra Disk - oder Premium SSD v2-Speicher .
- Speicherkapazität wird in GiB-Einheiten oder 1.024^3 Bytes angezeigt. Beachten Sie beim Vergleich von in GB (1000^3 Bytes) gemessenen Datenträgern mit in GiB (1024^3) gemessenen Datenträgern, dass die in GiB angegebenen Kapazitätszahlen kleiner erscheinen können. Beispiel: 1.023 GiB = 1.098,4 GB.
- Der Datenträgerdurchsatz wird in E/A-Vorgängen pro Sekunde (Input/Output Operations Per Second, IOPS) und MB/s gemessen, wobei MB/s = 10^6 Bytes/Sekunde beträgt.
- Datenträger können mit oder ohne Cache betrieben werden. Beim Datenträgerbetrieb mit Cache ist der Hostcachemodus auf ReadOnly oder ReadWrite festgelegt. Beim Datenträgerbetrieb ohne Cache ist der Hostcachemodus auf None festgelegt.
- Weitere Informationen, wie Sie die beste Speicherleistung für Ihre VMs erzielen können, finden Sie unter Leistung von virtuellen Computern und Datenträgern.
Netzwerkschnittstelleninformationen für jede Größe
Name der Größe |
Max. Front-End-NICs (Anzahl) |
Maximale Front-End-Bandbreite (Mbps) |
Max. NICs für zentrales Hochskalieren (Menge) |
Max Scale-Up Bandbreite (Gbps)1 |
Max. NICs für horizontales Skalieren (Anzahl) |
Max Scale-Out Bandbreite (TBps)2 |
Standard_ND128isr_NDR_GB200_v6 |
1 |
160 |
4 |
400 |
4 |
1.8 |
Netzwerkressourcen
Tabellendefinitionen
- 1 Die Bandbreite gilt pro NIC bis zu 100.000 GPUs über InfiniBand.
- 2 Bandbreite beträgt bis zu 72 GPUs pro Domäne über NVLINK
- Erwartete Netzwerkbandbreite ist die maximale aggregierte Bandbreite pro VM-Typ, die NIC-übergreifend für alle Ziele zugeordnet ist. Weitere Informationen finden Sie unter Netzwerkdurchsatz virtueller Computer
- Die Einhaltung von Obergrenzen wird nicht garantiert. Grenzwerte dienen als Richtlinien bei der Auswahl der richtigen VM-Art für die jeweilige Anwendung. Die tatsächliche Netzwerkleistung hängt von mehreren Faktoren ab. Hierzu zählen beispielsweise Netzwerküberlastung, Anwendungslasten und die Netzwerkeinstellungen. Informationen zum Optimieren des Netzwerkdurchsatzes finden Sie unter Optimieren des Netzwerkdurchsatzes für virtuelle Azure-Computer.
- Unter Umständen muss eine bestimmte Version ausgewählt oder der virtuelle Computer optimiert werden, um die erwartete Netzwerkbandbreite unter Linux oder Windows zu erzielen. Weitere Informationen finden Sie unter Testen der Bandbreite/des Durchsatzes (NTTTCP).
Informationen zu Beschleunigern (GPUs, FPGAs usw.) für jede Größe
Name der Größe |
Beschleuniger (Anzahl) |
Arbeitsspeicher der Beschleuniger (GB) |
Standard_ND128isr_NDR_GB200_v6 |
4 |
192 |
Liste aller verfügbaren Größen: Größen
Preisrechner: Preisrechner
Informationen zu Datenträgertypen: Datenträgertypen
Nächste Schritte
Nutzen Sie die neuesten für Ihre Workloads verfügbaren Leistung und Funktionen, indem Sie die Größe eines virtuellen Computers ändern.
Nutzen Sie die von Microsoft selbst entwickelten ARM-Prozessoren mit Azure Cobalt-VMs.
Erfahren Sie, wie Sie virtuelle Azure-Computer überwachen.