你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
ND-GB200-v6 系列虚拟机(VM)是 Azure GPU 系列的旗舰补充,为深度学习训练、生成 AI 和 HPC 工作负载提供无与伦比的性能。 这些 VM 利用基于 Blackwell 体系结构构建的 NVIDIA GB200 Tensor核心GPU,在计算能力、内存带宽和可伸缩性方面较前几代有显著提升。 每个 ND-GB200-v6 VM 由两个 NVIDIA Grace CPU 和四个 NVIDIA Blackwell GPU 提供支持。 GPU 通过第五代 NVLink 进行互连,每个 VM 总共提供 4× 1.8 TB/s NVLink 带宽。 这种可靠的纵向扩展互连可实现 VM 中 GPU 之间的无缝高速通信。 此外,VM 提供了一个横向扩展后端网络,每个 VM 有 4×400 GB/s 的 NVIDIA Quantum-2 CX7 InfiniBand 连接,确保在互连多个 VM 时实现高吞吐量和低延迟通信。 NVIDIA GB200 NVL72 每个机架最多连接 72 个 GPU,使系统能够作为单台计算机运行。 此 72 GPU 机架规模系统由 18 个 ND GB200 v6 VM 组组成,提供高达 1.4 Exa-FLOPS 的 FP4 Tensor Core 吞吐量、13.5 TB 的共享高带宽内存、130TB/秒的跨节 NVLINK 带宽和 28.8Tb/秒的横向扩展网络。
每个支持整个系统的 VM 配备 128 个 vCPU,该架构经过优化,可以有效地分配 AI 和科学应用程序的工作负载和内存需求。 此设计可实现无缝的多 GPU 缩放和大规模模型的可靠处理。 这些实例为 AI、ML 和分析工作负载提供一流的性能,并提供对 TensorFlow、PyTorch、JAX、RAPIDS 等框架的现成支持。 横向扩展 InfiniBand 互连针对基于 NVIDIA NCCL 通信库构建的现有 AI 和 HPC 工具进行了优化,可确保跨大型群集高效分布式计算。
主机规格
部件 | 数量 计数单位 |
规格 SKU ID、性能单位等 |
---|---|---|
处理器 | 128 个 vCPU | Nvidia Grace CPU |
内存 | 900GB VM | LPDDR |
本地存储 | 4 个磁盘 | 16TB NVME Direct |
远程存储 | 16 个磁盘 | 80000 IOPS/1200 MBps |
网络 | 1 个 NIC | 160Gb/s 以太网 |
加速器 | 4 个 GPU | Nvidia Blackwell GPU (192GB) |
功能支持
高级存储:支持
高级存储缓存:支持
实时迁移:不支持
内存保留更新:不支持
第 2 代 VM:受支持
第 1 代 VM:不支持
加速网络:支持
临时 OS 磁盘:受支持
嵌套虚拟化:不支持
系列大小
各尺寸的 vCPU 数量和内存
尺码名称 | 虚拟中央处理器(数量) | 内存 (GB) |
---|---|---|
Standard_ND128isr_NDR_GB200_v6 | 128 | 900 |
VM 基础知识资源
其他尺寸信息
所有可用大小的列表:大小
定价计算器:定价计算器
有关磁盘类型的信息:磁盘类型
后续步骤
通过更改虚拟机的大小来利用工作负载可用的最新性能和功能。
利用 Microsoft 内部设计的 ARM 处理器,与 Azure Cobalt VMs 配合使用。
了解如何监视 Azure 虚拟机。