High-Performance コンピューティング (HPC) システムは、大量のデータを処理し、高速で複雑な計算を実行するように設計されています。 パフォーマンスの理解と測定は、システムの最適化、調達の決定、およびアプリケーションがパフォーマンス要件を満たしていることを確認するために不可欠です。 このドキュメントでは、HPC パフォーマンスの概念とベンチマーク手法の包括的な概要について説明します。
主要なパフォーマンス メトリック
HPC システムのパフォーマンスを測定するために使用される基本的なメトリックを理解することは、意味のあるシステムの評価と比較に不可欠です。 比較のための客観的な測定値を提供し、システムのボトルネックを特定し、それによってパフォーマンスチューニングを可能にし、アプリケーションのパフォーマンスを予測するのに役立ちます。 パフォーマンス
HPC システムの計算機能は、計算と命令を実行する能力を定量化するさまざまなメトリックによって測定されます。
- FLOPS (1 秒あたりのFloating-Point 演算): システムの生の計算能力を測定します
- ピーク性能:システムで達成可能な理論上の最大性能
- 持続的なパフォーマンス: 実際の運用中に達成された実際のパフォーマンス
- IPS (1 秒あたりの命令数): プロセッサが命令を実行する速度
ベンチマーク カテゴリ
さまざまな種類のベンチマークは、特定のコンポーネントのテストから実際のアプリケーションパフォーマンスの評価まで、システムのパフォーマンスを評価するさまざまな目的に役立ちます。
合成ベンチマーク (特定のシステム コンポーネントまたは特性をテストする) |
アプリケーション ベンチマーク (実際のアプリケーションまたはそのプロキシ) |
カーネル ベンチマーク (アプリケーションの小さな自己完結型部分) |
---|---|---|
STREAM (メモリ帯域幅) | 気象調査と予測 (WRF) | NAS 並列ベンチマーク |
Intel MPI ベンチマーク (ネットワーク パフォーマンス) | GROMACS (分子動力学) | DOE CORAL ベンチマーク |
LINPACK (高密度線形代数) | NAMD (分子動力学) | ECP プロキシ アプリケーション |
HPCG (疎線形代数) | MILC (量子色力学) |
パフォーマンス分析方法
詳細なパフォーマンス データを収集し、HPC システムとアプリケーションのボトルネックを特定するために、さまざまな手法が採用されています。 最も一般的に使用されるメソッドは、プログラムの動作とリソース使用率パターンを理解するためにランタイム データを収集する プロファイリング です。 トレース メソッドでは、プログラムの実行とシステムの動作に関する詳細な時間情報をキャプチャして詳細な分析を行います。
プロファイリング
- 時間ベースプロファイリング: プログラムカウンターを定期的にサンプリングする
- イベント ベースのプロファイリング: ハードウェア カウンター データの収集
- 通信プロファイル: メッセージ パターンとタイミングの分析
- I/O プロファイル: ファイル システムのパフォーマンスの測定
追跡
- タイムライン分析: イベントの一時的な動作の記録
- メッセージ トレース: 通信パターンの分析
- ハードウェア カウンター トレース: 時間の経過に伴うハードウェア イベントの記録
パフォーマンスの最適化手法
これらの戦略は、HPC システムのさまざまな側面でシステムの効率とアプリケーションのパフォーマンスを最大化するのに役立ちます。 最も効果的な手法は、通常、3 つのカテゴリすべてから要素を結合し、システム全体のパフォーマンス特性を考慮したバランスの取れた最適化戦略を作成します。 多くの場合、これらの手法の組み合わせが特定のアプリケーションとシステム アーキテクチャに最も一致するかを特定することで成功します。
ベンチマークのベスト プラクティス
以下は確立されたベンチマークプラクティスであり、信頼性と再現可能なパフォーマンス測定を保証します。
方法論
- 明確な目標とメトリックを定義するには
- 代表的なベンチマークを選択する
- 一貫したテスト条件を確認する
- すべてのテスト パラメーターを文書化する
- 統計の有効性のために複数の実行を実行する
避ける一般的な落とし穴
- ウォームアップ期間が不十分
- 一貫性のないコンパイラ オプション
- サンプル サイズが不十分
- 非現実的な入力データセット
- システムの変動を無視する
レポートの要件
- システム構成の詳細'
- ソフトウェア スタック情報
- ベンチマーク パラメーター
- 未加工の結果および統計分析
- 環境条件
- 最適化の設定