SAP HANA のアラートについて調べる
最初の手順として、現在の SAP HANA アラート ログを確認します。 SAP HANA Studio で、[Administration Console](管理コンソール)>[Alerts](アラート)>[Show: all alerts](表示: すべてのアラート) に移動します。 このインターフェイスには、設定された最小および最大のしきい値を超えている特定の値 (空き物理メモリ、CPU 使用率など) に関するすべての SAP HANA アラートが表示されます。 既定では、チェックが 15 分ごとに自動更新されます。
しきい値の設定が不適切であるためにトリガーされたアラートの場合、解決方法は、既定値またはより適切なしきい値に再設定することです。
注意
次のいずれかに関する詳細なトラブルシューティング手順については、SAP HANA 2.0 のトラブルシューティングおよびパフォーマンス分析ガイドを参照してください。
CPU
以下のアラートは、CPU リソースの問題を示している場合があります。
- ホスト CPU 使用率 (アラート 5)
- 最新のセーブポイント操作 (アラート 28)
- セーブポイント期間 (アラート 54)
次のいずれかによって、SAP HANA データベースで CPU 使用率が高いことに気付くことがあります。
- 現在または過去の CPU 使用率で、アラート 5 (ホスト CPU 使用率) が発生する
- 概要画面に表示されている CPU 使用率
負荷グラフには、高い CPU 消費量または過去の高い消費量が示される場合があります。
高い CPU 使用率によってトリガーされるアラートの原因は、特定のトランザクションの実行、データの読み込み、応答していないジョブ、実行時間の長い SQL ステートメント、悪いクエリ パフォーマンス (HANA キューブでの BW など) など、いくつかのイベントによって発生する可能性があります (これらだけではありません)。
オペレーティング システム
Linux 上の SAP HANA に関する最も重要なチェックの 1 つは、透明の大きいページが無効になっていることを確認することです。「SAP Note #2131662」を参照してください。
透明の大きいページが有効になっているかどうかは、次の Linux コマンドを使用して確認できます: cat /sys/kernel/mm/transparent_hugepage/enabled
- always が角かっこで囲まれている場合は、透明の大きいページが有効であることを意味します:
[always] madvise never;
- never が角かっこで囲まれている場合は、透明の大きいページが無効であることを意味します:
always madvise [never]
次の Linux コマンドからは何も返されてはなりません: rpm -qa | grep ulimit
。 ulimit がインストールされていることが判明した場合は、すぐにアンインストールします。
メモリ
SAP HANA データベースによって割り当てられたメモリの量が予想よりも大きいことに気付く場合があります。 以下のアラートは、メモリ使用量が高いことに関連した問題を示しています。
- ホスト物理メモリ使用量 (アラート 1)
- ネーム サーバーのメモリ使用量 (アラート 12)
- 列ストア テーブルの合計メモリ使用量 (アラート 40)
- サービスのメモリ使用量 (アラート 43)
- 列ストア テーブルのメイン ストレージのメモリ使用量 (アラート 45)
- ランタイム ダンプ ファイル (アラート 46)
ネットワーク
「SAP Note #2081065」を参照し、この SAP Note のネットワーク トラブルシューティング手順を行います。
- サーバーとクライアントの間のラウンドトリップ時間を分析します。 SQL スクリプト
HANA_Network_Clients
を実行します。 - ノード間通信を分析します。 SQL スクリプト
HANA_Network_Services
を実行します。 - Linux コマンド
ifconfig
を実行します (出力には、パケット損失が発生しているかどうかが示されます)。 - Linux コマンド
tcpdump
を実行します。
さらに、オープン ソースの IPERF ツール (または同様のツール) を使用して、実際のアプリケーション ネットワーク パフォーマンスを測定します。
「SAP Note #2081065」で提供されているいくつかの SAP HANA ネットワーク トラブルシューティング手順は、サーバーとクライアントの間のラウンド トリップ時間 (RTT) とノード間通信を分析することで、SAP ランドスケープにおいてパフォーマンスの低下に影響するネットワーク待機時間の範囲を調べるのに役立ちます。
ストレージ
I/O のパフォーマンスに問題がある場合、エンド ユーザーからは、アプリケーション (またはシステム全体) の実行が遅い、アプリケーションが応答しない、さらには応答を停止しているように見えます。 SAP HANA Studio の [Volumes](ボリューム) タブでは、接続されているボリュームと、各サービスによって使用されているボリュームを確認できます。