NDm A100 v4 シリーズ

注意

この記事では、間もなくサポート終了 (EOL) 状態になる Linux ディストリビューションである CentOS について説明します。 適宜、使用と計画を検討してください。 詳細については、「CentOS のサポート終了に関するガイダンス」を参照してください。

適用対象: ✔️ Linux VM ✔️ Windows VM ✔️ フレキシブル スケール セット ✔️ 均一スケール セット

NDm A100 v4 シリーズの仮想マシン (VM) は、Azure GPU ファミリに新たに追加された主力製品です。 これは、ハイエンドのディープ ラーニング トレーニングと密結合のスケールアップおよびスケールアウト HPC ワークロード向けに設計されています。

NDm A100 v4 シリーズは、単一の VM と 8 つの NVIDIA Ampere A100 80GB Tensor Core GPU から始まります。 NDm A100 v4 ベースのデプロイでは、VM あたり 1.6 TB/秒の相互接続帯域幅を備えた数千の GPU までスケールアップできます。 VM 内の各 GPU には、トポロジに依存しない専用の 200 GB/秒 NVIDIA Mellanox HDR InfiniBand 接続が用意されています。 これらの接続は、同じ VM スケール セットを占有する VM 間で自動的に構成され、GPUDirect RDMA をサポートします。

各 GPU は、VM 内の通信用に NVLINK 3.0 接続を備えており、インスタンスは 96 個の物理第 2 世代 AMD Epyc™ 7V12 (Rome) CPU コアに支えられています。

これらのインスタンスは、GPU アクセラレーションを "標準" でサポートするさまざまな AI、ML、分析ツール (TensorFlow、Pytorch、Caffe、RAPIDS、そのほかのフレームワークなど) を活用して、優れたパフォーマンスを発揮します。 さらに、GMU のシームレスなクラスタリング用に NVIDIA の NCCL2 通信ライブラリに基づいて構築された、既存の AI および HPC ツールの大規模なセットによって、スケールアウト InfiniBand 相互接続がサポートされています。

重要

NDm A100 v4 VM の使用を開始するには、「HPC ワークロードの構成と最適化」を参照してドライバーとネットワークの構成などの手順を確認してください。 GPU メモリ I/O 占有領域の増加により、NDm A100 v4 では、第 2 世代の VM とマーケットプレース イメージを使用する必要があります。 AZURE HPC イメージを強くお勧めします。 Azure HPC Ubuntu 18.04、20.04、および Azure HPC CentOS 7.9 のイメージがサポートされています。


Premium Storage: サポートされています
Premium Storage キャッシュ: サポートされています
Ultra Disk: サポートされています (可用性、使用状況、およびパフォーマンスについては、詳細をご覧ください)
ライブ マイグレーション: サポートされていません
メモリ保持更新: サポートされていません
VM 世代サポート: 第 2 世代
高速ネットワーク:サポートされています
エフェメラル OS ディスク:サポートされています
InfiniBand: サポートされています, GPUDirect RDMA, 8 x 200 Gigabit HDR
Nvidia NVLink Interconnect:サポートされています
入れ子になった仮想化: サポートされていません

NDm A100 v4 シリーズは次のカーネル バージョンをサポートしています。
CentOS 7.9 HPC: 3.10.0-1160.24.1.el7.x86_64
Ubuntu 18.04: 5.4.0-1043-azure
Ubuntu 20.04: 5.4.0-1046-azure

サイズ vCPU メモリ:GiB 一時ストレージ (SSD): GiB GPU GPU メモリ: GiB 最大データ ディスク数 キャッシュが無効な場合の最大ディスク スループット: IOPS/MBps 最大ネットワーク帯域幅 最大 NIC 数
Standard_ND96amsr_A100_v4 96 1900 6400 8 A100 80 GB GPU (NVLink 3.0) 80 32 80,000 / 800 24,000 Mbps 8

サイズ表の定義

  • ストレージ容量は GiB (1024^3 バイト) 単位で示されています。 GB (1000^3 バイト) 単位のディスクと GiB (1024^3 バイト) 単位のディスクを比較する場合は、GiB 単位の方が容量の数値が小さく見えることに注意してください。 たとえば、1023 GiB = 1098.4 GB です。

  • ディスク スループットの測定単位は、1 秒あたりの入力/出力操作数 (IOPS) および MBps です (MBps = 10^6 バイト/秒)。

  • データ ディスクは、キャッシュを有効にしたモードでも無効化したモードでも動作します。 キャッシュを有効にしたデータ ディスクの操作では、ホスト キャッシュ モードは ReadOnly または ReadWrite に設定されています。 キャッシュを無効にしたデータ ディスクの操作では、ホスト キャッシュ モードは Noneに設定されています。

  • VM の最高のストレージ パフォーマンスを得る方法については、「仮想マシンとディスクのパフォーマンス」を参照してください。

  • 想定ネットワーク帯域幅は、すべての宛先について、すべての NIC で VM の種類ごとに割り当てられた最大集約帯域幅です。 詳しくは、「仮想マシンのネットワーク帯域幅」を参照してください。

    上限は保証されていません。 制限は、目的のアプリケーションに適した VM の種類を選択するためのガイダンスを示しています。 実際のネットワークのパフォーマンスは、ネットワークの輻輳、アプリケーションの負荷、ネットワーク設定などのさまざまな要因に左右されます。 ネットワーク スループットの最適化については、「Azure 仮想マシンのネットワーク スループットの最適化」を参照してください。 Linux または Windows で想定ネットワーク パフォーマンスを実現するには、特定のバージョンの選択または VM の最適化が必要になる場合があります。 詳細については、「帯域幅/スループットのテスト (NTTTCP)」を参照してください。

その他のサイズと情報

料金計算ツール: 料金計算ツール

ディスクの種類の詳細については、「Azure で利用できるディスクの種類」を参照してください

次のステップ

Azure コンピューティング ユニット (ACU) を確認することで、Azure SKU 全体の処理性能を比較できます。