次の方法で共有


Azure Stack HCI のログ アラートを設定する

適用対象: Azure Stack HCI バージョン 23H2 および 22H2

この記事では、Azure Stack HCI システムのログ アラートを設定する方法について説明します。Azure Stack HCI の分析情報を使用し、平均サーバー CPU、使用可能なメモリ、使用可能なボリューム容量など、既存のサンプル ログ クエリを使用します。

メトリック アラートを設定する方法については、「 Azure Stack HCI のメトリック アラートを設定する」を参照してください。

少し時間を取って、新しいログの収集、Insights ブックのカスタマイズ、ログを使用したアラートの作成に関するビデオ チュートリアルをwatchします。

前提条件

開始する前に、次の前提条件が満たされていることを確認してください。

  • デプロイおよび登録されている Azure Stack HCI クラスターにアクセスできます。
  • クラスターで Insights を有効にする必要があります。 Insights を有効にすると、Log Analytics ワークスペースで必要なログを収集するようにクラスターが構成されます。

Insights を使用してログ アラートを設定する

重要

重大度の高いアラートでは、Insights の使用は推奨されません。 ログの収集には 15 分かかる場合があります。

Insights を使用してログ アラートを設定するには、次の手順に従います。 前提条件を確認して完了していることを確認 します

  1. Azure portalから[監視] に移動するか検索し、[Azure Stack HCI] を選択します。

  2. いずれかのタブを選択して、リソースの正常性を表示します。 たとえば、[ サーバー ] を選択して、クラスター内のサーバーの正常性を表示します。

  3. ブックをカスタマイズし、青い ログ ビュー アイコンが表示されるまで編集します。 アイコンを選択して、クエリを表示および編集します。

    監視対象のリソースとリソースの正常性のスクリーンショット。

  4. クエリが読み込まれたら、[ + 新しいアラート ルール] を選択します。

    クラスターの [新しいアラート ルール] と新しいアラートを作成する方法のスクリーンショット。

  5. アラート インターフェイスから、アラートの条件やアクションなどを設定できます。 詳細については、「 クエリの結果をログに記録 する」と 「アラートアクションと詳細」を参照してください

    新しいアラートが作成されるタイミングを定義する項目のスクリーンショット。

サンプル ログ クエリを使用してアラートを設定する

azure Stack HCI システムの監視とアラートの設定を開始するには、Azure portalで使用可能な既存のログ クエリを使用します。 これらのクエリは、システムの正常性をチェックして監視するのに役立ちます。

サンプル ログ クエリを使用してログ アラートを設定するには、次の手順に従います。 前提条件を確認して完了していることを確認 します

  1. Azure portalで、Azure Stack HCI クラスター リソース ページを参照し、サンプル ログ クエリを使用して監視するクラスターを選択します。

  2. クラスターの [概要 ] ページで、[ JSON ビュー] を選択します。

    ClusteArmId を見つけるための [JSON ビュー] リンクのスクリーンショット。

  3. [ リソース ID ] ボックスから ClusterArmId の詳細をコピーします。

    ClusteArmId 情報をコピーする [リソース JSON] ページのスクリーンショット。

  4. Azure portalから、[監視] に移動または検索し、[ログ] を選択します

  5. [ + フィルターの追加] を選択して、[ リソースの種類] のフィルターを追加します。

  6. Azure Stack HCI システム サンプル ログの一覧を入力する場合は、[Azure Stack HCI] を選択します。

    Azure Monitor ログ領域とサンプル クエリにアクセスする方法のスクリーンショット。

  7. [読み込み] を選択してエディタークエリ ワークスペースを開きます。

  8. クラスター リソースにリンクされているログの スコープLog analytics ワークスペース に設定します。

  9. クラスターに関連する結果を表示するには、where ClusterArmId =~クエリのセクションに ClusterArmId の詳細を貼り付けます。

    ログ分析ワークスペースとクラスター Arm ID クエリのスクリーンショット。

  10. [実行] を選択します。

情報が表示されたら、ログを確認し、結果に基づいてアラートを作成できます。 詳細については、「 クエリの結果をログに記録 する」と 「アラートアクションと詳細」を参照してください

複数のクラスターのアラートを設定する

新しいクエリを設定するか、複数のクラスター ClusterArmId に対応するように既存のクエリを変更するには、 句をクエリに追加 | where ClusterArmId in~ します。 クエリで使用するクラスターごとに ClusterArmId を含めます。 たとえば、| where ClusterArmId in~ ('ClusterArmId1', 'ClusterArmId2', 'ClusterArmId3') のように指定します。

複数のクラスターのログを表示するクエリのスクリーンショット。

クエリ結果をログに記録する

ログを追加した後、クラスター ログを格納するワークスペースに対してクエリを実行して、期待される結果が得られることを確認する必要があります。 予想される結果が得られない場合は、ログ クエリを修正して再実行します。

新しいアラート ルールを作成する場合は、クエリ結果を要約するために条件付き詳細を設定する必要があります。 これらの詳細は、測定、ディメンションによる分割、アラート ロジックの 3 つのカテゴリに基づいています。 アラートの詳細で、次のコンポーネントを入力します。

  • メジャー: アラートの設定に使用される値。 既定では、数値のみを受け取ります。 値を整数に変換し、ドロップダウン リストから正しいものを選択します。
  • 集計の種類: 指定したクラスター メモリ値が 1 つだけ満たされている場合でも、アラートを受け取ります。 複数のクラスターでのアラートの場合は、集計の種類を平均または合計ではなく、最大値として設定する必要があります。
  • [リソース ID] 列: アラート メジャー値を他の値に基づいて分割します。 クラスターでアラートを取得するには、 または を clusterarmID 使用してサーバーのアラートを設定するには、 を使用 _resourceIDします。 正確さについては、ログ クエリで値の名前を確認します。
  • ディメンション名: アラート メジャーをさらに分割します。 たとえば、サーバーごとにアラートを取得するには、 を選択します Nodename
    • アラートを設定すると、ドロップダウン メニューにすべての値が表示されない場合があります。 [ 今後のすべての値を含める ] チェック ボックスをオンにして、クラスター内の複数のサーバーで同じアラートを確実に設定します。
  • しきい値: 設定した値に基づいて通知を提供します。

この例では、最大の集計の種類を持つメジャー値 Memoryusageint がしきい値の 15 分に達すると、アラートが表示されます。

指定するログ クエリの詳細のスクリーンショット。

詳細を設定したら、アラートの精度について条件を確認できます。

設定するアラート条件のスクリーンショット。

アラートアクションと詳細

クラスター アラートの通知を受け取る方法を決定するには、画像に示すように [ アクション ] タブを使用します。 新しいアクション グループを作成したり、既存のアクション グループのアラート ルールを設定したりできます。 電子メール、Event Hubs などを介して通知を受信することを選択できます。

アクション グループのアクション オプションのスクリーンショット。

アクションを設定すると、[ 詳細 ] タブでアラートの重大度、名前、説明、リージョンを設定できます。 [確認とCreate] を選択して、すべてのアラート設定の最終レビューを行い、アラートを作成します。

アラートのアクションの詳細のスクリーンショット。

アラートが設定されたら、[ アラート] タブ でアラート ルール、アクション グループなどを監視できます。

監視アラートのスクリーンショット。

ログ収集の頻度

既定では、ログは 1 時間ごとに生成されます。 ログを収集する頻度をチェックするには、次の PowerShell コマンドを使用します。

get-clusterresource "sddc management" | get-clusterparameter

ローカル コンピューターでのログ生成の頻度を変更するには、ログ収集パラメーターを CacheDumpIntervalInSeconds 変更します。

15 分ごとに設定されたログ頻度の例を次に示します。

get-clusterresource "sddc management" | set-clusterparameter -name "CacheDumpIntervalInSeconds" -value 900

注意

すべてのログを収集する頻度を 15 分未満に下げないでください。

次の手順

Azure Monitor アラート ルールをCreateする方法について説明します。