你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

GPU 优化虚拟机大小

适用于:✔️ Linux VM ✔️ Windows VM ✔️ 灵活规模集 ✔️ 统一规模集

提示

请尝试使用虚拟机选择器工具查找最适合你的工作负载的其他尺寸。

GPU 优化 VM 大小是具有单个、多个或部分 GPU 的专用虚拟机。 这些大小是针对计算密集型、图形密集型和可视化工作负荷设计的。 本文介绍有关 GPU、vCPU、数据磁盘和 NIC 的数量和类型的信息。 此分组中的每个大小还包括存储吞吐量及网络带宽。

  • NCv3 系列NC T4_v3 系列大小针对计算密集型 GPU 加速的应用程序进行了优化。 一些示例包括基于 CUDA 和 OpenCL 的应用程序以及模拟、AI 和深度学习。 NC T4 v3 系列专用于采用 NVIDIA Tesla T4 GPU 和 AMD EPYC2 Rome 处理器的推理工作负荷。 NCv3 系列带有 NVIDIA Tesla V100 GPU,专用于高性能计算和 AI 工作负载。

  • NC 100 v4 系列大小侧重于中型 AI 训练和批量推理工作负载。 使用 NC A100 v4 系列,可以灵活地为每台 VM 选择一个、两个或四个 NVIDIA A100 80GB PCIe Tensor Core GPU,以将合适大小的 GPU 加速用于工作负载。

  • ND A100 v4 系列大小侧重于纵向扩展和横向扩展深度学习训练以及加速的 HPC 应用程序。 ND A100 v4 系列使用 8 个 NVIDIA A100 TensorCore GPU,每个 GPU 都配备 200 千兆位 Mellanox InfiniBand HDR 连接和 40 GB GPU 内存。

  • NGads V620 系列 VM 大小针对 Azure 中托管的高性能交互式游戏体验进行了优化。 此系列虚拟机由 AMD Radeon PRO V620 GPU 和 AMD EPYC 7763 (Milan) CPU 提供支持。

  • NV 系列NVv3 系列大小已针对使用框架(如 OpenGL 和 DirectX)的远程可视化、流式处理、游戏、编码和 VDI 方案进行了优化和设计。 这些 VM 由 NVIDIA Tesla M60 GPU 提供支持。

  • NVv4 系列 VM 大小已针对 VDI 和远程可视化进行了优化和设计。 NVv4 具有已分区的 GPU,可为需要较少 GPU 资源的工作负载提供适当的大小。 这些 VM 由 AMD Radeon Instinct MI25 GPU 提供支持。 NVv4 VM 目前只支持 Windows 来宾操作系统。

  • NDm A100 v4 系列虚拟机是 Azure GPU 系列的新增旗舰,专为高端深度学习训练以及紧密耦合的纵向扩展和横向扩展 HPC 工作负载而设计。 NDm A100 v4 系列的起步配置是一个虚拟机 (VM) 和八个 NVIDIA Ampere A100 80GB Tensor Core GPU。

支持的操作系统和驱动程序

若要利用 Azure N 系列 VM 的 GPU 功能,必须安装 NVIDIA 或 AMD GPU 驱动程序。

部署注意事项

  • 有关 N 系列 VM 的可用性,请查看可用产品(按区域)

  • N 系列 VM 只能按 Resource Manager 部署模型部署。

  • N 系列的 VM 在对其磁盘支持的 Azure 存储类型方面有所不同。 NC 和 NV VM 仅支持标准磁盘存储 (HDD) 所支持的 VM 磁盘。 所有其他 GPU VM 都支持由标准磁盘存储和高级磁盘存储 (SSD) 支持的 VM 磁盘。

  • 如果需要部署的 N 系列 VM 较多,请考虑使用即用即付订阅或其他购买选项。 如果使用的是 Azure 免费帐户,则仅可以使用有限数量的 Azure 计算核心。

  • 可能需要提高 Azure 订阅中的核心配额(按区域)以及单独针对 NC、NCv2、NCv3、ND、NDv2、NV 或 NVv2 核心的配额。 若要请求增加配额,可免费 建立联机客户支持请求 。 默认限制可能因订阅类别而异。

其他大小

后续步骤

了解有关 Azure 计算单元 (ACU) 如何帮助跨 Azure SKU 比较计算性能的详细信息。