InfiniBand 対応の HB シリーズおよび N シリーズの VM でのハイ パフォーマンス コンピューティング

適用対象: ✔️ Linux VM ✔️ Windows VM ✔️ フレキシブル スケール セット ✔️ 均一スケール セット

Azure の InfiniBand 対応の H シリーズおよび N シリーズ VM は、実環境のさまざまな HPC ワークロードと AI ワークロードに対するリーダー クラスのパフォーマンス、メッセージ パッシング インターフェイス (MPI) のスケーラビリティ、コスト効率が提供されるように設計されています。 これらのハイ パフォーマンス コンピューティング (HPC) に最適化された VM は、流体力学、地球モデリング、気象シミュレーションなど、サイエンスおよびエンジニアリングにおける非常に多くの計算を要する問題を解決するために使用されます。

これらの記事では、Azure で InfiniBand 対応の H シリーズおよび N シリーズ VM を使い始める方法と、スケーラビリティのために VM 上の HPC および AI ワークロードを最適に構成する方法について説明します。

特徴と機能

InfiniBand 対応の HB シリーズおよび N シリーズの VM は、最高の HPC パフォーマンス、MPI のスケーラビリティ、HPC ワークロードのコスト効率を実現するように設計されています。 VM の特徴と機能の詳細については、HB シリーズおよび N シリーズ VM のページを参照してください。

RDMA と InfiniBand

RDMA 対応HB シリーズおよび N シリーズ VM の通信は、低遅延で高帯域幅の InfiniBand ネットワークを介して行われます。 そのような相互接続を介した RDMA 機能は、分散ノードの HPC および AI ワークロードのスケーラビリティとパフォーマンスを向上させるために重要です。 InfiniBand 対応の H シリーズおよび N シリーズの VM は、最適で一貫した RDMA のパフォーマンスのため、小直径設計の非ブロッキング ファット ツリーで接続されます。 InfiniBand 対応の VM での InfiniBand のセットアップについて詳しくは、「InfiniBand の有効化」をご覧ください。

Message Passing Interface

SR-IOV が有効な HB シリーズと N シリーズでは、ほとんどすべての MPI ライブラリとバージョンがサポートされています。 最も一般的に使用される MPI ライブラリは、Intel MPI、OpenMPI、HPC-X、MVAPICH2、MPICH、Platform MPI などです。 すべてのリモート ダイレクト メモリ アクセス (RDMA) 動詞がサポートされています。 サポートされているさまざまな MPI ライブラリのインストールと最適な構成の詳細については、MPI のセットアップに関するページを参照してください。

はじめに

最初のステップでは、VM の仕様と RDMA の機能に基づいて、ワークロードに最適な HB シリーズおよび N シリーズの VM の種類を選択します。 2 番目に、InfiniBand を有効にして VM を構成します。 これを行うには、ドライバーが組み込まれている最適化された VM イメージの使用など、さまざまな方法があります。詳細については、Linux 用の最適化に関するページおよび「InfiniBand の有効化」を参照してください。 3 番目に、分散ノードのワークロードの場合、MPI を適切に選択して構成することが重要です。 詳細については、MPI のセットアップに関するページを参照してください。 4 番目に、パフォーマンスとスケーラビリティのため、VM ファミリに固有のガイダンスに従って、ワークロードを最適に構成します。ガイダンスには、HBv3 シリーズの概要HC シリーズの概要に関するページなどがあります。

次のステップ