通过


你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

NDm_A100_v4 大小系列

NDm A100 v4 系列虚拟机 (VM) 是 Azure GPU 系列的新增旗舰产品。 这些大小专为高端深度学习训练和紧密耦合的纵向扩展和横向扩展 HPC 工作负荷而设计。

NDm A100 v4 系列的起步配置是一个 VM 和八个 NVIDIA Ampere A100 80GB Tensor Core GPU。 基于 NDm A100 v4 的部署可以纵向扩展到成千上万个 GPU,每个 VM 的互连带宽为 1.6 TB/秒。 VM 内的每个 GPU 都具备其自己专用的、与拓扑无关的 200 GB/秒 NVIDIA Mellanox HDR InfiniBand 连接。 这些连接在占用相同 Azure 虚拟机规模集的 VM 之间自动配置,并且支持 GPU Direct RDMA。

每个 GPU 都具有 NVLINK 3.0 连接功能,可在 VM 内进行通信,背后是 96 个物理第二代 AMD Epyc™ 7V12 (Rome) CPU 核心。

这些实例为众多 AI、ML、支持 GPU 加速的现成分析工具(如 TensorFlow、Pytorch、Caffe、RAPIDS)以及其他框架提供卓越的性能。 此外,横向扩展 InfiniBand 互连支持一大组基于 NVIDIA 的 NCCL2 通信库构建的现有 AI 和 HPC 工具,以便实现无缝的 GPU 群集化。

主机规格

组成部分 数量
计数单位
规格
SKU ID、性能单位等。
处理器 96 个 vCPU AMD EPYC 7V12 (罗马) [x86-64]
内存 1900 GiB
本地存储 1 个磁盘 6400 GiB
远程存储 32 个磁盘 80000 IOPS
800 MBps
网络 8 个 NIC 24000 Mbps
加速器 8 个 GPU Nvidia A100 GPU (80GB)

功能支持

系列大小

每种大小的 vCPU(数量)和内存量

大小名称 vCPU(数量) 内存 (GB)
Standard_ND96amsr_A100_v4 96 1900

VM 基础知识资源

其他大小信息

所有可用大小的列表:大小

定价计算器:定价计算器

有关磁盘类型的信息:磁盘类型

Next steps

通过更改虚拟机的大小来利用工作负载可用的最新性能和功能。

使用 Microsoft 内部设计的 ARM 处理器和 Azure Cobalt VM

了解如何监视 Azure 虚拟机