OpenMP からコンカレンシーランタイムへの移行

[アーティクル]
06/16/2023

コンカレンシーランタイムでは、さまざまなプログラミングモデルを使用できます。これらのモデルは、他のライブラリのモデルと重複する場合や、他のライブラリのモデルを補完する場合があります。このセクションでは、OpenMP とコンカレンシーランタイムの違いについて説明し、既存の OpenMP コードからコンカレンシーランタイムの使用に移行する方法の例を示します。

OpenMP プログラミングモデルは、オープン標準により定義されており、Fortran および C/C++ プログラミング言語へのバインドが適切に定義されています。 Microsoft C++ コンパイラでサポートされている OpenMP バージョン 2.0 および 2.5 は、反復処理の並列アルゴリズムに適しています。つまり、これらは、データの配列を並列に反復処理します。 OpenMP 3.0 では、反復的なタスクに加えて、非反復なタスクがサポートされています。

OpenMP は、並列化の度合いが事前に決定され、システムで使用可能なリソースと対応する場合に最も効果的です。 OpenMP モデルは、非常に大きい計算の問題が 1 台のコンピューターの処理リソース全体に分散される高パフォーマンスのコンピューティングに特に適しています。このシナリオでは、ハードウェア環境が全体的に固定されており、開発者は、このアルゴリズムが実行されるときに、すべてのコンピューティングリソースへの排他アクセスがあることを合理的に期待できます。

ただし、制約が少ないコンピューティング環境は、OpenMP に適していない場合があります。たとえば、再帰の問題 (クイックソートアルゴリズム、データツリーの検索など) を、OpenMP 2.0 および 2.5 を使用して実装することはより難しくなります。コンカレンシーランタイムは、非同期エージェントライブラリや並列パターンライブラリ (PPL) を提供することで、OpenMP の機能を補完します。非同期エージェントライブラリでは、粒度の粗いタスクの並列処理がサポートされています。一方、PPL では、より詳細な並列タスクがサポートされています。コンカレンシーランタイムには、操作を並列で実行するために必要なインフラストラクチャが備わっているため、アプリケーションのロジックに集中できます。ただし、コンカレンシーランタイムによってさまざまなプログラミングモデルが有効になるため、そのスケジューリングオーバーヘッドは、OpenMP などの他のコンカレンシーライブラリよりも大きい可能性があります。そのため、既存の OpenMP コードを変換して、コンカレンシーランタイムを使用する場合は、パフォーマンスを段階的にテストすることをお勧めします。

OpenMP からコンカレンシーランタイムに移行するケース

既存の OpenMP コードを移行して、コンカレンシーランタイム使用すると便利な場合を以下に示します。

ケース	コンカレンシーランタイムの利点
拡張可能な同時実行プログラミングフレームワークが必要である。	コンカレンシーランタイムの機能の多くは拡張できます。既存の機能を組み合わせて新しい機能を作成することもできます。 OpenMP はコンパイラディレクティブに依存しているため、簡単には拡張できません。
アプリケーションが協調ブロッキングからメリットを得る可能性がある。	まだ使用できないリソースが必要であるためにタスクがブロックされた場合、コンカレンシーランタイムは、最初のタスクがリソースを待機している間に他のタスクを実行できます。
アプリケーションが、動的負荷分散からメリットを得られる可能性がある。	コンカレンシーランタイムは、ワークロードの変化に応じてコンピューティングリソースの割り当てを調整するスケジューリングアルゴリズムを使用します。 OpenMP では、スケジューラがコンピューティングリソースを並列リージョンに割り当てると、それらのリソース割り当ては計算全体で固定されます。
例外処理のサポートが必要である。	PPL を使用すると、並列領域またはループの内部と外側の両方で例外をキャッチできます。 OpenMP では、並列領域またはループ内で例外を処理する必要があります。
キャンセルメカニズムが必要である。	PPL を使用すると、アプリケーションは個々のタスクと並列作業ツリーの両方を取り消しできます。 OpenMP では、アプリケーションが独自のキャンセルメカニズムを実装する必要があります。
開始時とはことなるコンテキストで終了するための並列コードが必要である。	コンカレンシーランタイムを使用して、特定のコンテキストでタスクを開始し、それとは別のコンテキストでタスクの待機または取り消しを行えます。 OpenMP では、並列処理はすべて、開始時のコンテキストで完了する必要があります。
デバッグのサポートを強化する必要がある。	Visual Studio には、[並列スタック] ウィンドウと [並列タスク] ウィンドウが備わっており、マルチスレッド化されたアプリケーションをより簡単にデバッグできます。コンカレンシーランタイムのデバッグサポートの詳細については、「[タスク] ウィンドウの使用」、「[並列スタック] ウィンドウの使用」、および「チュートリアル: 並列アプリケーションのデバッグ」を参照してください。

OpenMP からコンカレンシーランタイムに移行しないケース

既存の OpenMP コードを移行してコンカレンシーランタイムを使用するのが適切ではない可能性のあるケースを次に示します。

ケース	説明
アプリケーションが既に要件を満たしている。	アプリケーションのパフォーマンスと現在のデバッグサポートに満足している場合、移行は適切ではない可能性があります。
並列ループの本体が、ほとんど作業を実行しない。	特にループ本体が比較的小さい場合、コンカレンシーランタイムタスクスケジューラーのオーバーヘッドが、ループ本体を並列で実行するメリットを上回らない可能性があります。
アプリケーションは C で記述されている。	コンカレンシーランタイムでは多数の C++ 機能が使用されるため、C アプリケーションで完全に使用できるコードを記述できない場合、適していない可能性があります。

方法: OpenMP の parallel for ループを変換し、コンカレンシーランタイムを使用する

OpenMP の parallel ディレクティブと for ディレクティブを使用する基本的なループを変換して、コンカレンシーランタイムの concurrency::parallel_for アルゴリズムを使用する方法を示します。

方法: キャンセル処理を使用する OpenMP ループを変換し、コンカレンシーランタイムを使用する
必ずしもすべての反復を実行する必要のない OpenMP parallel for ループを変換して、コンカレンシーランタイムの取り消しメカニズムを使用する方法を示します。

方法: 例外処理を使用する OpenMP ループを変換し、コンカレンシーランタイムを使用する
例外処理を実行する OpenMP parallel for ループを変換して、コンカレンシーランタイムの例外処理メカニズムが使用されるようにする方法を示します。

方法: 減少変数を使用する OpenMP ループを変換し、コンカレンシーランタイムを使用する
 reduction 句を使用する OpenMP parallel for ループを変換して、コンカレンシーランタイムを使用する方法を示します。

次の方法で共有

OpenMP からコンカレンシーランタイムへの移行

OpenMP からコンカレンシーランタイムに移行するケース

OpenMP からコンカレンシーランタイムに移行しないケース

関連項目

フィードバック

フィードバック

その他のリソース

次の方法で共有

OpenMP からコンカレンシー ランタイムへの移行

OpenMP からコンカレンシー ランタイムに移行するケース

OpenMP からコンカレンシー ランタイムに移行しないケース

関連項目

関連項目

フィードバック

フィードバック

その他のリソース

OpenMP からコンカレンシーランタイムへの移行

OpenMP からコンカレンシーランタイムに移行するケース

OpenMP からコンカレンシーランタイムに移行しないケース