HC シリーズの仮想マシンの概要
適用対象: ✔️ Linux VM ✔️ Windows VM ✔️ フレキシブル スケール セット ✔️ 均一スケール セット
Intel Xeon スケーラブル プロセッサで HPC アプリケーションのパフォーマンスを最大限に引き出すには、この新しいアーキテクチャにプロセスを配置する慎重なアプローチが必要です。 ここでは、HPC アプリケーション用の Azure HC シリーズ VM への実装の概要を説明します。 物理 NUMA ドメインを指す場合は “pNUMA”、仮想化 NUMA ドメインを指す場合は “vNUMA” を使用します。 同様に、物理 CPU コアを指す場合は "pCore"、仮想化 CPU コアを指す場合は "vCore" という用語を使用します。
物理的には、HC シリーズのサーバーは 2 * 24 コアの Intel Xeon Platinum 8168 CPU で合計 48 個の物理コアです。 各 CPU は 1 つの pNUMA ドメインであり、6 チャネルの DRAM に統一されたアクセス権を持っています。 Intel Xeon Platinum CPU は、以前の世代よりも 4 倍大きい L2 キャッシュ (256 KB/コア-> 1 MB/コア) を備えていると同時に、以前の Intel CPU (2.5 MB/コア -> 1.375 MB/コア) と比較して L3 キャッシュも削減します。
上記のトポロジは、HC シリーズのハイパーバイザー構成にも引き継がれます。 Azure ハイパーバイザーが VM に干渉せずに動作する余地を確保するために、pCore 0-1 および 24-25 (つまり、各ソケットの最初の 2 つの pCore) を予約します。 次に、pNUMA ドメインの残りのすべてのコアを VM に割り当てます。 そのため、VM では以下が認識されます。
VM あたり (2 vNUMA domains) * (22 cores/vNUMA) = 44
コア
VM は、pCore 0-1 と 24-25 が与えられていないことを認識していません。 そのため、ネイティブに 22 個のコアがあるかのように各 vNUMA が公開されています。
Intel Xeon Platinum、Gold、および Silver の CPU は、CPU ソケット内外と通信するためのオンダイ 2D メッシュ ネットワークも導入しています。 最適なパフォーマンスと一貫性のために、プロセス固定を強くお勧めします。 基になるシリコンはそのままゲスト VM に公開されるため、プロセス固定は HC シリーズ VM で機能します。
次の図は、Azure Hypervisor と HC シリーズ VM 用に予約されているコアの分離を示しています。
ハードウェア仕様
ハードウェア仕様 | HC シリーズ VM |
---|---|
コア | 44 (HT 無効) |
CPU | Intel Xeon Platinum 8168 |
CPU 周波数 (非 AVX) | 3.7 GHz (シングル コア)、2.7-3.4 GHz (すべてのコア) |
メモリ | 8 GB/コア (合計 352) |
ローカル ディスク | 700 GB SSD |
Infiniband | 100 Gb EDR Mellanox ConnectX-5 |
ネットワーク | 50 GB イーサネット (40 GB 使用可能) Azure 第 2 世代 SmartNIC |
ソフトウェア仕様
ソフトウェア仕様 | HC シリーズ VM |
---|---|
最大 MPI ジョブ サイズ | 13200 コア (1 つの仮想マシン スケール セットに 300 台の VM、singlePlacementGroup=true) |
MPI のサポート | HPC-X、Intel MPI、OpenMPI、MVAPICH2、MPICH、Platform MPI |
その他のフレームワーク | UCX、libfabric、PGAS |
Azure Storage のサポート | Standard および Premium ディスク (最大 4 ディスク) |
SRIOV RDMA の OS サポート | RHEL 7.6 以降、Ubuntu 20.04 以降、SLES 15.4、WinServer 2016 以降 |
Orchestrator のサポート | CycleCloud、Batch、AKS、クラスター構成オプション |
Note
AMD によるカーネル レベルの公式サポートは RHEL 8.6 と AlmaLinux 8.6 (RHEL の派生版) からとなります。
次のステップ
- Intel Xeon SP アーキテクチャの詳細を確認します。
- Azure Compute Tech Community のブログで、最新の発表、HPC ワークロードの例、およびパフォーマンスの結果について参照します。
- HPC ワークロードの実行をアーキテクチャの面から見た概要については、「Azure でのハイ パフォーマンス コンピューティング (HPC)」をご覧ください。