你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

ND GB200-v6 大小系列

ND-GB200-v6 系列虚拟机(VM)是 Azure GPU 系列的旗舰补充,为深度学习训练、生成 AI 和 HPC 工作负载提供无与伦比的性能。 这些 VM 利用基于 Blackwell 体系结构构建的 NVIDIA GB200 Tensor核心GPU,在计算能力、内存带宽和可伸缩性方面较前几代有显著提升。 每个 ND-GB200-v6 VM 由两个 NVIDIA Grace CPU 和四个 NVIDIA Blackwell GPU 提供支持。 GPU 通过第五代 NVLink 进行互连,每个 VM 总共提供 4× 1.8 TB/s NVLink 带宽。 这种可靠的纵向扩展互连可实现 VM 中 GPU 之间的无缝高速通信。 此外,VM 提供了一个横向扩展后端网络,每个 VM 有 4×400 GB/s 的 NVIDIA Quantum-2 CX7 InfiniBand 连接,确保在互连多个 VM 时实现高吞吐量和低延迟通信。 NVIDIA GB200 NVL72 每个机架最多连接 72 个 GPU,使系统能够作为单台计算机运行。 此 72 GPU 机架规模系统由 18 个 ND GB200 v6 VM 组组成,提供高达 1.4 Exa-FLOPS 的 FP4 Tensor Core 吞吐量、13.5 TB 的共享高带宽内存、130TB/秒的跨节 NVLINK 带宽和 28.8Tb/秒的横向扩展网络。

每个支持整个系统的 VM 配备 128 个 vCPU,该架构经过优化,可以有效地分配 AI 和科学应用程序的工作负载和内存需求。 此设计可实现无缝的多 GPU 缩放和大规模模型的可靠处理。 这些实例为 AI、ML 和分析工作负载提供一流的性能,并提供对 TensorFlow、PyTorch、JAX、RAPIDS 等框架的现成支持。 横向扩展 InfiniBand 互连针对基于 NVIDIA NCCL 通信库构建的现有 AI 和 HPC 工具进行了优化,可确保跨大型群集高效分布式计算。

主机规格

部件 数量
计数单位
规格
SKU ID、性能单位等
处理器 128 个 vCPU Nvidia Grace CPU
内存 900GB VM LPDDR
本地存储 4 个磁盘 16TB NVME Direct
远程存储 16 个磁盘 80000 IOPS/1200 MBps
网络 1 个 NIC 160Gb/s 以太网
加速器 4 个 GPU Nvidia Blackwell GPU (192GB)

功能支持

高级存储:支持
高级存储缓存:支持
实时迁移:不支持
内存保留更新:不支持
第 2 代 VM:受支持
第 1 代 VM:不支持
加速网络:支持
临时 OS 磁盘:受支持
嵌套虚拟化:不支持

系列大小

各尺寸的 vCPU 数量和内存

尺码名称 虚拟中央处理器(数量) 内存 (GB)
Standard_ND128isr_NDR_GB200_v6 128 900

VM 基础知识资源

其他尺寸信息

所有可用大小的列表:大小

定价计算器:定价计算器

有关磁盘类型的信息:磁盘类型

后续步骤

通过更改虚拟机的大小来利用工作负载可用的最新性能和功能。

利用 Microsoft 内部设计的 ARM 处理器,与 Azure Cobalt VMs 配合使用。

了解如何监视 Azure 虚拟机