Azure 上での貯留層シミュレーション ソフトウェアの実行

Azure CycleCloud
Azure Key Vault
Azure Virtual Machines

"貯留層シミュレーション" では、データ集約型のコンピューター モデルを使用して、地球の地下にある石油、水、ガスなどの複雑な液体フローを予測します。 この例では、Azure ハイパフォーマンス コンピューティング (HPC) インフラストラクチャ上で貯留層シミュレーション ソフトウェアを設定します。 Azure では、パフォーマンス、スケーラビリティ、およびコスト効率を最大にして、この種類のワークロードを実行できます。

アーキテクチャ

貯水池シミュレーション アーキテクチャを示す図。

このアーキテクチャの Visio ファイルをダウンロードします。

ワークフロー

この図は、この例で使用されているアーキテクチャの概要を示しています。 ワークフローは次のとおりです。

  1. ユーザーは、SSH を介してヘッド ノードにサインインし、コンピューティング リソース用のモデルを準備します。

  2. PBS Pro 19.1 はヘッド ノード上で実行され、計算ノード上でジョブをスケジュールします。

  3. OPM Flow は、計算ノード上で実行されます。 コンピューティング VM は仮想マシン スケール セットとしてデプロイされます。これは、コンピューティング タスクのニーズを満たすようにスケーリングされる同一 VM のグループです。

  4. OPM Flow によって、計算結果がヘッド ノード上のファイル共有に送信されます。 Premium ディスクはヘッド ノードに接続され、計算ノードと視覚化 VM 用の NFS サーバーとして設定されます。

  5. Standard-NV6 Windows VM 上で実行されている OPM ResInsight では、結果の 3D 視覚化が表示されます。 ユーザーは、RDP を通じて視覚化 VM にアクセスできます。

コンポーネント

このアーキテクチャの実装に使用される主要テクノロジ:

シナリオの詳細

この例のアーキテクチャでは、OPM Flow がサポートされています。これは、Open Porous Media (OPM) イニシアチブによる、広く普及しているオープンソースの石油およびガス貯留層シミュレーション パッケージです。 OPM Flow ソフトウェアは、現在のオンプレミス インフラストラクチャに近い、またはより高いパフォーマンスを発揮する Azure HPC 仮想マシン (VM) 上で実行されます。

ユーザーは、Linux ヘッド ノード VM に接続して、PBS Pro 19.1 ジョブ スケジューリング ソフトウェアを通じて HPC リソースにモデルを送信します。 HPC リソースは OPM Flow を実行し、計算結果をファイル共有に送信します。 この例では、ファイル共有はヘッドノード VM 上の 4 テラバイト (TB) のネットワーク ファイル システム (NFS) 領域です。 モデルと入出力 (I/O) の要件に応じて、他のストレージ オプションを使用できます。

オープンソースの視覚化ツールである OPM ResInsight を実行している Microsoft Azure VM は、ファイル共有にアクセスして、計算結果をモデル化および視覚化します。 ユーザーは、リモート デスクトップ プロトコル (RDP) を使用して VM に接続し、視覚化を表示できます。

Azure VM を使用すると、ハイエンドの視覚化ワークステーションの費用を節約できます。 OPM アプリケーションは、HPC ハードウェア、および入出力ファイル用の共有ストレージの場所を利用できます。

考えられるユース ケース

  • 3D 貯留層のモデル化と地震データの視覚化を行います。

  • Schlumberger の高解像度貯留層シミュレーターである INTERSECT をテストします。 GitHub で INTERSECT のサンプル実装を確認できます。

  • Azure 上で同様のセットアップを使用して、Landmark-Halliburton による Nexus をテストします。

考慮事項

これらの考慮事項は、ワークロードの品質向上に使用できる一連の基本原則である Azure Well-Architected Framework の要素を組み込んでいます。 詳細については、「Microsoft Azure Well-Architected Framework」を参照してください。

この例では、高パフォーマンス VM の HB シリーズを使用します。 HB シリーズは、計算流体力学 (CFD) などのメモリ帯域幅に基づいたアプリケーション向けに最適化されています。Standard_HB120rs_v2 VM はその中の最新シリーズです。 Intel ベースのハードウェアについては、Standard_HC44rs VM を選択できます。

この OPM Flow アーキテクチャを Azure 上でテストするために、GitHub の実装例では、実際のノルウェーの海底油田のオープンベンチマーク ケースである Norne ケースがインストールされます。 このテスト ケースを実行するには、次のことを行う必要があります。

  • Azure Key Vault を使用して、GitHub セットアップ スクリプトの要件であるキーとシークレットを格納します。

  • すべての計算ノード上に Linear Algebra PACKage (LAPACK) ライブラリをインストールします。 GitHub のインストール スクリプトには、このステップが含まれます。

  • 視覚化の受信者として使用する任意のコンピューターに、HP Remote Graphics Software (RGS) をインストールします。 この例では、ユーザーが視覚化 VM に接続して ResInsight を実行し、Norne ケースを表示します。

ジョブ スケジューラ

コンピューティング集中型のワークロードは、HPC コンピューティングおよびストレージ インフラストラクチャをデプロイして管理できる HPC オーケストレーション ソフトウェアの恩恵を受けます。 このアーキテクチャ例には、コンピューティングをデプロイする 2 つの方法 (azurehpc フレームワークまたは Azure CycleCloud) が含まれています。

Azure CycleCloud は、Azure 上で HPC とビッグ コンピューティング クラスターを作成、管理、運用、最適化するためのツールです。 これを使用すると、Azure HPC クラスターを動的にプロビジョニングし、ハイブリッドおよびクラウド ワークフローのデータとジョブを調整できます。 Azure CycleCloud では、Azure 上の HPC ワークロードに対して、Grid Engine、HPC Pack、HTCondor、LSF、PBS Pro、Slurm、Symphony などの複数のワークロード マネージャーがサポーされます。

ネットワーク

このワークロード例では、異なるサブネット内に VM をデプロイします。 セキュリティを強化するために、各サブネットに対してネットワーク セキュリティ グループを定義できます。 たとえば、さまざまなノードとの間のネットワーク トラフィックを許可または拒否するセキュリティ規則を設定できます。 このレベルのセキュリティが必要ない場合は、この実装に個別のサブネットは必要ありません。

ストレージ

データ ストレージとアクセスのニーズは、ワークロードのスケールによって大きく異なります。 Azure では、HPC アプリケーションの速度と容量を管理するためのいくつかのアプローチがサポートされます。 azurehpc GitHub リポジトリには、サンプルの Azure HPC スクリプトが含まれています。

石油およびガス業界では、次のアプローチが一般的です。 I/O と容量の独自の要件に最適なソリューションを選択してください。

  • 現在の例のような低スケールのワークロードでは、要件に応じて、大規模な一時ディスクを搭載したストレージ最適化 Lsv2 シリーズ VM または Azure Premium Storage を搭載した D シリーズ VM を使用して、ヘッド ノード上で NFS を実行することを検討します。 このソリューションは、500 コア以下、最大 1.5 ギガバイト/秒 (GiB/秒) のスループット、最大 19 TB の RAM と 100 TB のストレージのワークロードに適しています。

  • 中規模から大規模の読み取り集中型のワークロード:Avere vFXT for Azure (6 から 24 ノード) の使用を検討します。 このソリューションは、最大 50,000 コア、書き込みの場合は最大 2 GiB/秒、読み取りの場合は最大 14 GiB/秒のスループット、最大 192 TB のキャッシュ、最大 2 ペタバイト (PB) のファイル サーバーのワークロードに対応しています。

  • 均衡型または書き込み集中型の中規模ワークロード: 最大 4,000 コア、最大 6.5 GiB/秒のスループット、最大 100 TB/ボリュームのストレージ、12 TB の最大ファイル サイズのワークロードには、Azure NetApp Files の使用を検討してください。

  • 大規模ワークロード: Lustre や BeeGFS など、調整された並列ファイル サービスを使用します。 このアプローチは、最大 50,000 コア、最大 50 GiB/秒の読み取り/書き込みレート、500 TB のストレージに対応しています。 さらに大規模なクラスターでは、ベアメタル アプローチの方がコスト効率が高くなる可能性があります。 たとえば、Cray ClusterStor は、より大規模なエラスティック クラスターを即時にサポートする柔軟性を備えたマネージド HPC ストレージ ソリューションです。

このシナリオのデプロイ

GitHub でこの OPM Flow アーキテクチャの実装例を取得します。

次のステップ