你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

已更新 NDv2 系列

适用于:✔️ Linux VM ✔️ Windows VM ✔️ 灵活规模集 ✔️ 统一规模集

NDv2 系列虚拟机是 GPU 系列中新增的系列,旨在满足最严苛 GPU 加速 AI、机器学习、模拟和 HPC 工作负载的需求。

NDv2 由 8 个 NVIDIA Tesla V100 NVLINK 连接的 GPU 提供支持,每个 GPU 都有 32 GB 的 GPU 内存。 每个 NDv2 VM 还具有 40 个非超线程的 Intel Xeon Platinum 8168 (Skylake) 核心和 672 GiB 的系统内存。

NDv2 实例使用 CUDA GPU 优化计算内核、众多 AI、ML、支持 GPU 加速的现成分析工具(如 TensorFlow、Pytorch、Caffe、RAPIDS)以及其他框架,为 HPC 和 AI 工作负载提供卓越的性能。

最重要的是,NDv2 是为计算密集型纵向扩展(每个 VM 利用 8 个 GPU)和横向扩展(利用多个协同工作的 VM)工作负载而构建的。 NDv2 系列现在支持 100 GB InfiniBand EDR 后端网络(类似于 HB 系列 HPC VM 上提供的网络),可对并行场景执行高性能聚类分析,包括针对 AI 和 ML 的分布式训练。 此后端网络支持所有主要的 InfiniBand 协议(包括 NVIDIA 的 NCCL2 库使用的协议),可实现 GPU 的无缝聚类分析。

重要

在 ND40rs_v2 VM 上启用 InfiniBand 时,请使用 4.7-1.0.0.1 Mellanox OFED 驱动程序。

由于 GPU 内存增加,新的 ND40rs_v2 VM 需要使用第 2 代 VM 和市场映像。

请注意:每 GPU 内存为 16 GB 的 ND40s_v2 不再提供预览版,已被更新的 ND40rs_v2 取代。


高级存储:支持
高级存储缓存:支持
超级磁盘:支持(详细了解可用性、使用情况和性能)
实时迁移:不支持
内存保留更新:不支持
VM 代系支持:第 2 代
加速网络:支持
临时 OS 磁盘:支持
InfiniBand:支持
Nvidia NVLink 互连:支持
嵌套虚拟化:不支持

大小 vCPU 内存:GiB 临时存储 (SSD):GiB GPU GPU 内存:GiB 最大数据磁盘数 非缓存磁盘最大吞吐量:IOPS / MBps 最大网络带宽 最大 NIC 数
Standard_ND40rs_v2 40 672 2948 8 V100 32 GB (NVLink) 32 32 80000 / 800 24000 Mbps 8

支持的操作系统和驱动程序

若要利用 Azure N 系列 VM 的 GPU 功能,必须安装 NVIDIA GPU 驱动程序。

NVIDIA GPU 驱动程序扩展可在 N 系列 VM 上安装适当的 NVIDIA CUDA 或 GRID 驱动程序。 请使用 Azure 门户或工具(例如 Azure PowerShell 或 Azure 资源管理器模板)安装或管理该扩展。 有关 VM 扩展的常规信息,请参阅 Azure 虚拟机扩展和功能

如果选择手动安装 NVIDIA GPU 驱动程序,请参阅适用于 Linux 的 N 系列 GPU 驱动程序安装

大小表定义

  • 存储容量的单位为 GiB 或 1024^3 字节。 比较以 GB(1000^3 字节)为单位的磁盘和以 GiB(1024^3 字节)为单位的磁盘时,请记住以 GiB 为单位的容量数显得更小。 例如,1023 GiB = 1098.4 GB。

  • 磁盘吞吐量的单位为每秒输入/输出操作数 (IOPS) 和 Mbps,其中 Mbps = 10^6 字节/秒。

  • 数据磁盘可以在缓存或非缓存模式下运行。 对于缓存数据磁盘操作,主机缓存模式设置为 “ReadOnly”“ReadWrite”。 对于非缓存数据磁盘操作,主机缓存模式设置为 "None"

  • 如要了解如何为虚拟机获得最佳存储性能,请参阅虚拟机和磁盘性能

  • 预期的网络带宽是指跨所有 NIC 为每个 VM 类型分配的最大聚合带宽,适用于所有目标。 有关详细信息,请参阅虚拟机网络带宽

    上限不能保证。 这些限制能够为目标应用程序选择适当的虚拟机类型提供指导。 实际的网络性能取决于多种因素,比如网络拥塞、应用程序负载和网络设置。 有关如何优化网络吞吐量的信息,请参阅为 Azure 虚拟机优化网络吞吐量。 如要在 Linux 或 Windows 中达到预期的网络性能,可能需要选择特定的版本或优化虚拟机。 有关详细信息,请参阅带宽/吞吐量测试 (NTTTCP)

其他大小和信息

定价计算器:定价计算器

有关磁盘类型的详细信息,请参阅 Azure 有哪些可用的磁盘类型?

后续步骤

了解有关 Azure 计算单元 (ACU) 如何帮助跨 Azure SKU 比较计算性能的详细信息。