ND A100 v4-シリーズ

適用対象: ✔️ Linux VM ✔️ フレキシブル スケール セット ✔️ 均一スケール セット。

ND A100 v4 シリーズの仮想マシン (VM) は、Azure GPU ファミリに新たに追加された主力製品です。 これは、ハイエンドのディープ ラーニング トレーニングと密結合のスケールアップおよびスケールアウト HPC ワークロード向けに設計されています。

ND A100 v4 シリーズは、単一の VM と 8 つの NVIDIA Ampere A100 40GB Tensor Core GPU から始まります。 ND A100 v4 ベースのデプロイでは、VM あたり 1.6 TB/秒の相互接続帯域幅を備えた数千の GPU までスケールアップできます。 VM 内の各 GPU には、トポロジに依存しない専用の 200 GB/秒 NVIDIA Mellanox HDR InfiniBand 接続が用意されています。 これらの接続は、同じ VM スケール セットを占有する VM 間で自動的に構成され、GPUDirect RDMA をサポートします。

各 GPU は、VM 内の通信用に NVLINK 3.0 接続を備えており、インスタンスは 96 個の物理第 2 世代 AMD Epyc™ 7V12 (Rome) CPU コアに支えられています。

これらのインスタンスは、GPU アクセラレーションを "標準" でサポートするさまざまな AI、ML、分析ツール (TensorFlow、Pytorch、Caffe、RAPIDS、そのほかのフレームワークなど) を活用して、優れたパフォーマンスを発揮します。 さらに、GMU のシームレスなクラスタリング用に NVIDIA の NCCL2 通信ライブラリに基づいて構築された、既存の AI および HPC ツールの大規模なセットによって、スケールアウト InfiniBand 相互接続がサポートされています。

重要

ND A100 v4 VM の使用を開始するには、「HPC ワークロードの構成と最適化」を参照してドライバーとネットワークの構成などの手順を確認してください。 GPU メモリ I/O 占有領域の増加により、ND A100 v4 では、第 2 世代の VM とマーケットプレース イメージを使用する必要があります。

Azure では、Ubuntu 20.04/22.04、RHEL 7.9/8.7/9.3、AlmaLinux 8.8/9.2、SLES 15 for ND A100 v4 の VM がサポートされています。 Azure Marketplace には、さまざまな HPC ツールとライブラリがインストールされ、HPC/AI ワークロード用に最適化されて事前構成済みの Linux VM イメージのオファリングが用意されているので、それを強くお勧めします。 現在は、Ubuntu-HPC 20.04/22.04 と AlmaLinux-HPC 8.6/8.7 VM イメージがサポートされています。


Premium Storage: サポートされています
Premium Storage キャッシュ: サポートされています
Ultra Disk: サポートされています (可用性、使用状況、およびパフォーマンスについては、詳細をご覧ください)
ライブ マイグレーション: サポートされていません
メモリ保持更新: サポートされていません
VM 世代サポート: 第 2 世代
高速ネットワーク:サポートされています
エフェメラル OS ディスク:サポートされています
InfiniBand: サポートされています (GPUDirect RDMA、8 x 200 Gigabit HDR)
Nvidia NVLink Interconnect: サポートされています
入れ子になった仮想化: サポートされていません

[サイズ] vCPU メモリ:GiB 一時ストレージ (SSD): GiB GPU GPU メモリ: GiB 最大データ ディスク数 キャッシュが無効な場合の最大ディスク スループット: IOPS/MBps 最大ネットワーク帯域幅 最大 NIC 数
Standard_ND96asr_A100_v4 96 900 6000 8 A100 40-GB GPUs (NVLink 3.0) 320 32 80,000 / 800 24,000 Mbps 8

サイズ表の定義

  • ストレージ容量は GiB (1024^3 バイト) 単位で示されています。 GB (1000^3 バイト) 単位のディスクと GiB (1024^3 バイト) 単位のディスクを比較する場合は、GiB 単位の方が容量の数値が小さく見えることに注意してください。 たとえば、1023 GiB = 1098.4 GB です。

  • ディスク スループットの測定単位は、1 秒あたりの入力/出力操作数 (IOPS) および MBps です (MBps = 10^6 バイト/秒)。

  • データ ディスクは、キャッシュを有効にしたモードでも無効化したモードでも動作します。 キャッシュを有効にしたデータ ディスクの操作では、ホスト キャッシュ モードは ReadOnly または ReadWrite に設定されています。 キャッシュを無効にしたデータ ディスクの操作では、ホスト キャッシュ モードは Noneに設定されています。

  • VM の最高のストレージ パフォーマンスを得る方法については、「仮想マシンとディスクのパフォーマンス」を参照してください。

  • 想定ネットワーク帯域幅は、すべての宛先について、すべての NIC で VM の種類ごとに割り当てられた最大集約帯域幅です。 詳しくは、「仮想マシンのネットワーク帯域幅」を参照してください。

    上限は保証されていません。 制限は、目的のアプリケーションに適した VM の種類を選択するためのガイダンスを示しています。 実際のネットワークのパフォーマンスは、ネットワークの輻輳、アプリケーションの負荷、ネットワーク設定などのさまざまな要因に左右されます。 ネットワーク スループットの最適化については、「Azure 仮想マシンのネットワーク スループットの最適化」を参照してください。 Linux または Windows で想定ネットワーク パフォーマンスを実現するには、特定のバージョンの選択または VM の最適化が必要になる場合があります。 詳細については、「帯域幅/スループットのテスト (NTTTCP)」を参照してください。

その他のサイズと情報

料金計算ツール: 料金計算ツール

ディスクの種類の詳細については、「Azure で利用できるディスクの種類」を参照してください

次のステップ

Azure コンピューティング ユニット (ACU) を確認することで、Azure SKU 全体の処理性能を比較できます。