この記事では、クラスター フェールオーバーが発生し、クラスター フェールオーバー アラートが発生した後に失敗した Analytics Platform System (PDW) ノードの名前を確認する方法について説明します。 クラスター フェールオーバーのトラブルシューティングの一環として、Microsoft に連絡して問題を解決する前に、失敗したノードの名前を特定する必要があります。
背景
SQL Server PDW で高可用性を実現するために、制御ノードと計算ノードは、Windows フェールオーバー クラスターのアクティブまたはパッシブ コンポーネントとして構成されます。 アクティブ サーバーが重要なシステム要求に応答できない場合、パッシブ サーバーはフェールオーバーし、失敗したサーバーの機能を実行します。
クラスターのフェールオーバー後、SQL Server PDW がノードの状態を報告すると、パッシブ サーバーはフェールオーバー状態になります。 ただし、失敗したサーバーがまだオンラインの場合は特に、失敗したサーバーまたはノードは明らかではありません。 クラスター障害のトラブルシューティングを行うには、フェールオーバーしたノードの名前を決定する必要があります。
管理コンソールの解決策
失敗したノードの名前を見つける
- 管理コンソールを開きます。 管理コンソールの詳細については、「管理コンソールを使用したアプライアンスの監視 (Analytics Platform System)」を参照してください。 フェールオーバーが発生すると、フェールオーバー イベントが [正常性] ページのアラートの数に含まれます。 PDW リージョンとアプライアンスのファブリック リージョンの [HEALTH] ページがあります。 各正常性ページには、[アラート] タブがあります。アラートの詳細については、[正常性] ページの [アラート] タブを選択し、アラートを選択します。
システム ビュー ソリューション
次の SQL ステートメントは、sys.dm_pdw_component_health_active_alerts システム ビューを使用して、失敗したサーバーの名前を検索する方法を示しています。
SELECT
SUBSTRING( component_instance_id, 2, charindex(' ', component_instance_id, 1)-2) AS failed_node_name,
create_time AS failover_time
FROM sys.dm_pdw_component_health_active_alerts
WHERE alert_id = 500139
ORDER BY failed_node_name;