イベント ID 1135 に関するクラスターの問題のトラブルシューティング

この記事は、フェールオーバー クラスタリング環境でのクラスター サービスの起動時にログに記録される可能性があるイベント ID 1135 を診断して解決するのに役立ちます。

適用対象:Windows Server 2022、Windows Server 2019、Windows Server 2016、Azure Stack HCI、バージョン 21H2 および 20H2

仮想エージェントを試す - Active Directory レプリケーションに関する一般的な問題をすばやく特定して修正するのに役立ちます。

開始ページ

イベント ID 1135 は、アクティブなフェールオーバー クラスター メンバーシップから 1 つ以上のクラスター ノードが削除されたことを示します。 これは、次の症状を伴う可能性があります:

検証とネットワーク テストは、問題の原因となる可能性のある構成の問題がないことを確認するための最初のトラブルシューティング手順の 1 つとして推奨されます。

クラスター サービスは、フェールオーバー クラスター操作のすべての側面を制御し、クラスター構成データベースを管理する重要なソフトウェア コンポーネントです。 イベント ID 1135 が表示される場合は、次の記事で説明されている修正プログラムをインストールし、クラスターのすべてのノードを再起動してから、問題が再発するかどうかを確認することをお勧めします。

クラスター サービスがすべてのノードで実行されているかどうかを確認する

Windows オペレーティング システムに従って次のコマンドに従って、クラスター サービスが継続的に実行され、使用可能であることを確認します。

Windows Server 2008 R2 クラスターの場合

管理者特権でのコマンド プロンプトから cluster.exe node /stat を実行します。

R2 クラスターのWindows Server 2012とWindows Server 2012

次の PowerShell コマンドレットを実行します。 Get-ClusterResource

クラスター サービスは継続的に実行され、すべてのノードで使用できますか?

イベント ID 1135 のいくつかのシナリオ

クラスターのすべてのノードのシステム イベント ログを詳しく見ていただきたいと思います。 ノードに表示されているイベント ID 1135 を確認し、このイベントのすべてのインスタンスをコピーします。 これにより、それらを見てレビューするのに便利です。

Event ID 1135
Cluster node ' **NODE A** ' was removed from the active failover cluster membership. The Cluster service on this node may have stopped. 
This could also be due to the node having lost communication with other active nodes in the failover cluster. 
Run the Validate a Configuration wizard to check your network configuration. 
If the condition persists, check for hardware or software errors related to the network adapters on this node. 
Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.

次の 3 つの一般的なシナリオがあります。

シナリオ A

すべてのイベントを確認しており、クラスター内のすべてのノードは、NODE A が通信を失ったことを示しています。

ノード A、ノード B、およびノード C が正常に通信することを示す図。

ノード A がノード B およびノード C との通信を失っていることを示す図。

NODE A でシステム ログが表示されている場合は、クラスター内の残りのすべてのノードのイベントが存在する可能性があります。

ソリューション

これは、問題が発生した時点で、ネットワークの輻輳が原因であるか、それ以外の場合は NODE A への通信が失われたことを示しています。

ネットワークの構成と通信に関する問題を確認して検証する必要があります。 ノード A に関連する問題を探してください。

シナリオ B

ノード上のイベントを確認し、クラスターが 2 つのサイトに分散しているとします。 サイト 1 の NODE A、NODE B、NODE C、およびサイト 2 の NODE D & NODE E。

サイト 1 が WAN リンク経由でサイト 2 と正常に通信していることを示す図。

ノード A、B、C では、ログに記録されるイベントはノード D & E への接続用であることがわかります。同様に、ノード D & E にイベントが表示されると、イベントは A、B、C との通信が失われたことを示唆します。

サイト 1 がサイト 2 との WAN リンク接続を失っていることを示す図。

ソリューション

同様のアクティビティが表示された場合は、これらのサイトを接続するリンク経由で通信エラーが発生したことを示します。 サイト間の接続を確認することをお勧めします。これが WAN 接続を経由している場合は、接続について ISP に確認することをお勧めします。

シナリオ C

ノード上のイベントを確認すると、ノードの名前が特定のパターンと一緒に集計されないことがわかります。 クラスターが 2 つのサイトに分散しているとします。 ノード A、サイト 1 の NODE B、NODE C、およびサイト 2 の NODE D & NODE E。

  • ノード A: ノード B、D、E のイベントが表示されます。
  • ノード B: ノード C、D、E のイベントが表示されます。
  • ノード C: ノード A、B、E のイベントが表示されます。
  • ノード D: ノード A、C、E のイベントが表示されます。
  • ノード E: ノード B、C、D のイベントが表示されます。
  • または他の組み合わせ。

クラスターが 2 つのサイトに分散していることを示すシナリオ C の図。

ソリューション

このようなイベントは、ノード間のネットワーク チャネルが切断され、クラスター通信メッセージがタイムリーに到達しない場合に発生し、クラスター間の通信が失われたとクラスターが感じられ、クラスター メンバーシップからノードが削除される可能性があります。

クラスター ネットワークを確認する

このトラブルシューティング ガイドを続行するには、次の 3 つのオプションを 1 つずつ確認して、クラスター ネットワークを確認することをお勧めします。

ウイルス対策の除外を確認する

クラスター サービスを実行しているサーバーでのウイルス スキャンから、次のファイル システムの場所を除外します。

  • FileShare 監視のパス
  • %Systemroot%\Cluster フォルダー

ウイルス対策ソフトウェア内のリアルタイム スキャン コンポーネントを構成して、次のディレクトリとファイルを除外します。

  • 既定の仮想マシン構成ディレクトリ (C:\ProgramData\Microsoft\Windows\Hyper-V)

  • カスタム仮想マシン構成ディレクトリ

  • 既定の仮想ハード ディスク ドライブ ディレクトリ (C:\Users\Public\Documents\Hyper-V\Virtual Hard Disks)

  • カスタム仮想ハード ディスク ドライブ ディレクトリ

  • Hyper-V レプリカを使用している場合は、カスタム レプリケーション データ ディレクトリ

  • スナップショット ディレクトリ

  • mms.exe

    注:

    このファイルは、ウイルス対策ソフトウェア内のプロセス除外として構成する必要があります。

  • Vmwp.exe

    注:

    このファイルは、ウイルス対策ソフトウェア内のプロセス除外として構成する必要があります。

さらに、クラスター共有ボリュームと共に Live Migration を使用する場合は、CSV パス C:\Clusterstorage とそのすべてのサブディレクトリを除外します。 フェールオーバーの問題やクラスター サービスとウイルス対策ソフトウェアに関する一般的な問題のトラブルシューティングを行っている場合は、ウイルス対策ソフトウェアを一時的にアンインストールするか、ソフトウェアの製造元にチェックして、ウイルス対策ソフトウェアがクラスター サービスで動作するかどうかを判断します。 ほとんどの場合、ウイルス対策ソフトウェアを無効にするだけでは不十分です。 ウイルス対策ソフトウェアを無効にした場合でも、コンピューターを再起動してもフィルター ドライバーが読み込まれます。

ファイアウォールでネットワーク ポートの構成を確認する

クラスター サービスは、サーバー クラスターの処理を制御し、クラスター データベースを管理します。 クラスターとは、単一のコンピューターとして機能する、独立したコンピューターの集合です。 マネージャー、プログラマ、ユーザーには、クラスターは単一のシステムとして表示されます。 ソフトウェアによってクラスターのノード間でデータの分散が行われるため、 1 つのノードでエラーが発生しても、他のノードによって、失われたノードで提供されていたサービスとデータが提供されます。 ノードが追加または修復されると、クラスター ソフトウェアによりそのノードに一部のデータが移行されます。

システム サービス名: ClusSvc

アプリケーション プロトコル ポート
クラスター サービス UDP 3343
クラスター サービス TCP 3343 (このポートは、ノードの参加操作時に必要です)
RPC TCP 135
クラスター 管理 UDP 137
Kerberos UDP/TCP 464*
SMB TCP 445
ランダムに割り当てられた高い UDP ポート** UDP 1024 ~ 65535 のランダムなポート番号
49152 ~ 65535*** のランダム ポート番号

注:

さらに、Windows Server 2008 以降の Windows フェールオーバー クラスターで検証を成功させるには、ICMP4、ICMP6 の受信トラフィックと送信トラフィックを許可します。

これは、Windows Server 2012、Windows 8、Windows Server 2008 R2、Windows 7、Windows Server 2008、および Windows Vista の範囲です。

また、次のコマンドを実行して、ファイアウォールでネットワーク ポートの構成をチェックします。 例: このコマンドは、フェールオーバー クラスターに使用されるポート 3343 available\open を決定するのに役立ちます。

netsh advfirewall firewall show rule name="Failover Clusters (UDP-In)" verbose

エラーまたは警告に対してクラスター検証レポートを実行する

クラスター検証ツールは、一連のテストを実行して、ハードウェアと設定がフェールオーバー クラスタリングと互換性があることを確認します。

手順は次のとおりです。

  1. エラーまたは警告に対してクラスター検証レポートを実行します。 詳細については、「クラスター検証テストについて: ネットワーク」を参照してください。

    エラーまたは警告のクラスター検証レポートを実行した後の結果のスクリーンショット。

  2. ネットワークの警告とエラーを確認します。 詳細については、「 クラスター検証テストについて: ネットワーク」を参照してください。

    カテゴリ別の結果のスクリーンショット。

    [ネットワーク] の [Windows ファイアウォール構成の検証] のスクリーンショット。

ネットワーク バインド順序の一覧表示を確認する

このテストでは、各ノードのアダプターにネットワークをバインドする順序を一覧表示します。

[ アダプターとバインド ] タブには、接続がネットワーク サービスによってアクセスされる順序で接続が一覧表示されます。 これらの接続の順序は、汎用 TCP/IP 呼び出し/パケットがワイヤに送信される順序を反映します。

ネットワーク アダプターのバインド順序を変更するには、次の手順に従います。

  1. [ スタート] を選択 し、[実行] を選択 し、「ncpa.cpl」と入力し、[OK] を選択 します。 使用可能な接続は、[ネットワーク Connections] ウィンドウの [LAN] セクションと [インターネット High-Speed] セクションで確認できます。
  2. [ 詳細設定 ] メニューの [ 詳細設定] を選択し、[ アダプターとバインド ] タブを選択します。
  3. [Connections] 領域で、一覧で上位に移動する接続を選択します。 矢印ボタンを使用して接続を移動します。 一般に、ネットワークと通信するカード (ドメイン接続、他のネットワークへのルーティングなど) は、最初のバインド (リストの先頭) カードである必要があります。

クラスター ノードは、マルチホーム システムです。 ネットワークの優先順位は、送信ネットワーク接続の DNS クライアントに影響します。 クライアント通信に使用されるネットワーク アダプターは、バインド順序の先頭に存在する必要があります。 ルーティングされていないネットワークは、優先順位を低くできます。 Windows Server 2012 および Windows Server 2012 R2 では、クラスター ネットワーク ドライバー (NETFT.SYS) アダプターがバインド順序の一覧の下部に自動的に配置されます。

ネットワーク通信の検証

ネットワーク上の待機時間によって、これが発生する可能性もあります。 パケットはノード間で失われない可能性がありますが、タイムアウト期間が切れる前に十分に高速にノードに到達しない可能性があります。

このテストでは、テスト対象のサーバーが、すべてのネットワークで許容可能な待機時間と通信できることを検証します。

たとえば、[ネットワーク通信の検証] の下に、ネットワーク待機時間の問題に関する次のメッセージが表示される場合があります。

Succeeded in pinging network interface node003.contoso.com IP Address 192.168.0.2 from network interface node004.contoso.com IP Address 192.168.0.3 with maximum delay 500 after 1 attempt(s).
Either address 10.0.0.96 is not reachable from 192.168.0.2 or **the ping latency is greater than the maximum allowed 2000 ms** 
This may be expected, since network interfaces node003.contoso.com - Heartbeat Network and node004.contoso.com - Production Network are on different cluster networks
Either address 192.168.0.2 is not reachable from 10.0.0.96 or **the ping latency is greater than the maximum allowed 2000 ms** 
This may be expected, since network interfaces node004.contoso.com - Production Network and node003.contoso.com - Heartbeat Network for MSCS are on different cluster networks

マルチサイト クラスターの場合は、タイムアウト値を増やすことがあります。 詳細については、「 マルチサイト フェールオーバー クラスターでハートビートと DNS 設定を構成する」を参照してください。

WAN 接続の問題がないか ISP に確認します。

次のいずれかの問題が発生したかどうかを確認します。

ノード間で失われたネットワーク パケット
  1. パフォーマンスを使用してパケット損失を確認する

    ノード間のどこかのワイヤでパケットが失われた場合、ハートビートは失敗します。 パフォーマンス モニターを使用して、"ネットワーク インターフェイス\パケットが破棄されました" カウンターを確認することで、これが問題であるかどうかを簡単に確認できます。 このカウンターを追加したら、Average、Minimum、Maximum の各数値を確認し、値が 0 より大きい場合は、アダプターの受信バッファーを調整する必要があります。

    [カウンターの追加] ウィンドウのスクリーンショット。

    VMware 仮想化プラットフォームでネットワーク パケットが失われた場合は、「VMware 仮想化プラットフォームにインストールされているクラスター」セクションを参照してください。

  2. NIC ドライバーをアップグレードする

    この問題は、古い NIC ドライバー\統合コンポーネント (IC)\VmTools または NIC アダプターの障害が原因で発生する可能性があります。 物理マシン上のノード間でネットワーク パケットが失われた場合は、ネットワーク アダプター ドライバーを更新してください。 古いまたは古いネットワーク カードドライバーやファームウェア。 場合によっては、ネットワーク カードまたはスイッチの単純な構成ミスによって、ハートビートが失われる可能性もあります。

VMware 仮想化プラットフォームにインストールされているクラスター

VMware 環境の場合に VMware アダプターの問題を確認します。

この問題は、トラフィックバーストが多い間にパケットがドロップされた場合に発生する可能性があります。 トラフィック フィルターが発生しないようにします (メール フィルターなど)。 この可能性を排除した後、ゲスト オペレーティング システム内のバッファーの数を徐々に増やし、確認します。

バースト トラフィックのドロップを減らすには、次の手順に従います。

  1. [ スタート] を選択し、[ 実行] を選択し、「」と入力 devmgmt.msc して Enter キーを押します。
  2. [ ネットワーク アダプター] を展開し、 vmxnet3 を右クリックし、[プロパティ] を選択 します
  3. [詳細設定] タブを選択します。
  4. [ Small Rx Buffers]\(小さい Rx バッファー\) を 選択し、値を大きくします。 既定値は 512 で、最大値は 8192 です。
  5. [ Rx リング] #1 [サイズ] を選択し、値を増やします。 既定値は 1024 で、最大値は 4096 です。

VMware 環境の場合に VMware アダプターの問題を確認するには、次の記事を確認してください。

ネットワークの輻輳に注意してください

ネットワークの輻輳は、ネットワーク接続の問題を引き起こす可能性もあります。

MS とベンダーの推奨事項に従ってネットワークが構成されていることを確認します。 「Windows フェールオーバー クラスター ネットワークの構成」を参照してください。

ネットワーク構成を確認する

それでもうまくいかない場合は、クラスター GUI でパーティション分割されたネットワークが表示されているか、ハートビート NIC で NIC チーミングが有効になっている場合は、チェックしてください。

クラスター GUI にパーティション分割されたネットワークが表示される場合は、「 パーティション分割されたクラスター ネットワーク」 を参照して問題のトラブルシューティングを行います。

ハートビート NIC で NIC チーミングを有効にしている場合は、チーミング ベンダーの推奨事項に従ってチーミング ソフトウェア機能をチェックします。

NIC ドライバーをアップグレードする

この問題は、古い NIC ドライバーまたは NIC アダプターの障害が原因で発生する可能性があります。

物理マシン上のノード間でネットワーク パケットが失われた場合は、ネットワーク アダプター ドライバーを更新してください。 古いまたは古いネットワーク カードドライバーやファームウェア。

場合によっては、ネットワーク カードまたはスイッチの単純な構成ミスによって、ハートビートが失われる可能性もあります。

ネットワーク構成を確認する

それでも動作しない場合は、クラスター GUI でパーティション分割されたネットワークが表示されているか、ハートビート NIC で NIC チーミングが有効になっているかをチェックします。