你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
NC A100 v4 系列
注意
本文引用了 CentOS,这是一个接近生命周期结束 (EOL) 状态的 Linux 发行版。 请相应地考虑你的使用和规划。 有关详细信息,请参阅 CentOS 生命周期结束指南。
适用于:✔️ Linux VM ✔️ Windows VM ✔️ 灵活规模集 ✔️ 统一规模集
NC A100 v4 系列虚拟机 (VM) 是 Azure GPU 系列的新增成员。 此系列可用于实际的 Azure 应用 AI 训练和批处理推理工作负载。
NC A100 v4 系列由 NVIDIA A100 PCIe GPU 和第三代 AMD EPYC™ 7V13 (Milan) 处理器提供技术支持。 VM 配置最多 4 个 NVIDIA A100 PCIe GPU(每个具有 80 GB 的内存)、多达 96 个非多线程 AMD EPYC Milan 处理器核心,以及 880 GiB 的系统内存。 这些 VM 非常适合实际的应用 AI 工作负载,例如:
- GPU 加速分析和数据库
- 具有大量预处理和后期处理工作的批处理推理
- 自治模型训练
- 油气储层模拟
- 机器学习 (ML) 开发
- 视频处理
- AI/ML Web 服务
支持的功能
若要开始使用 NC A100 v4 VM,请参阅 HPC 工作负荷配置和优化,了解包括驱动程序和网络配置在内的步骤。
由于 GPU 内存 I/O 占用量增加,NC A100 v4 需要使用第 2 代 VM 和市场映像。 尽管我们建议使用 Azure HPC 映像,但也支持 Azure HPC Ubuntu 20.04 和 Azure HPC CentOS 7.9、RHEL 8.8、RHEL 9.2、Windows Server 2019 以及 Windows Server 2022 映像。
- 高级存储:支持
- 高级存储缓存:支持
- 超级磁盘:不支持
- 实时迁移:不支持
- 内存保留更新:不支持
- VM 代系支持:第 2 代
- 加速网络:支持
- 临时 OS 磁盘:支持
- 无限宽带:不支持
- NVIDIA NVLink 互连:支持
- 嵌套虚拟化:不支持
大小 | vCPU | 内存 (GiB) | 临时磁盘1 (GiB) | NVMe 磁盘2 | GPU3 | GPU 内存 (GiB) | 最大数据磁盘数 | 非缓存磁盘的最大吞吐量 (IOPS / MBps) | 最大网卡数/网络带宽等级 (MBps) |
---|---|---|---|---|---|---|---|---|---|
Standard_NC24ads_A100_v4 | 24 | 220 | 64 | 960 GB | 1 | 80 | 8 | 30000/1000 | 2/20,000 |
Standard_NC48ads_A100_v4 | 48 | 440 | 128 | 2x960 GB | 2 | 160 | 16 | 60000/2000 | 4/40,000 |
Standard_NC96ads_A100_v4 | 96 | 880 | 256 | 4x960 GB | 4 | 320 | 32 | 120000/4000 | 8/80,000 |
1 NC A100 v4 系列 VM 具有标准的基于 SCSI 的临时资源磁盘,用于 OS 分页/交换文件的使用。 这确保 NVMe 驱动器可以完全专用于应用程序的使用。 此磁盘是临时的,停止/解除分配时将丢失所有数据。
2 本地 NVMe 磁盘是临时的,如果停止/解除分配 VM,这些磁盘上的数据都将丢失。 本地 NVMe 磁盘作为 RAM 提供,需要在新部署的 VM 中手动设置格式。
31 GPU = 一张 A100 80GB PCIe GPU 卡
大小表定义
存储容量的单位为 GiB 或 1024^3 字节。 比较以 GB(1000^3 字节)为单位的磁盘和以 GiB(1024^3 字节)为单位的磁盘时,请记住以 GiB 为单位的容量数显得更小。 例如,1023 GiB = 1098.4 GB。
磁盘吞吐量的单位为每秒输入/输出操作数 (IOPS) 和 Mbps,其中 Mbps = 10^6 字节/秒。
数据磁盘可以在缓存或非缓存模式下运行。 对于缓存数据磁盘操作,主机缓存模式设置为 “ReadOnly” 或 “ReadWrite”。 对于非缓存数据磁盘操作,主机缓存模式设置为 "None"。
如要了解如何为虚拟机获得最佳存储性能,请参阅虚拟机和磁盘性能。
预期的网络带宽是指跨所有 NIC 为每个 VM 类型分配的最大聚合带宽,适用于所有目标。 有关详细信息,请参阅虚拟机网络带宽。
上限不能保证。 这些限制能够为目标应用程序选择适当的虚拟机类型提供指导。 实际的网络性能取决于多种因素,比如网络拥塞、应用程序负载和网络设置。 有关如何优化网络吞吐量的信息,请参阅为 Azure 虚拟机优化网络吞吐量。 如要在 Linux 或 Windows 中达到预期的网络性能,可能需要选择特定的版本或优化虚拟机。 有关详细信息,请参阅带宽/吞吐量测试 (NTTTCP)。
其他大小和信息
可以使用定价计算器来估算 Azure VM 成本。
有关磁盘类型的详细信息,请参阅 Azure 有哪些可用的磁盘类型?