AlwaysOn 可用性グループのトラブルシューティングと監視のガイド
THIS TOPIC APPLIES TO: SQL Server (starting with 2008) Azure SQL Database Azure SQL Data Warehouse Parallel Data Warehouse
このガイドでは、いくつかの AlwaysOn 可用性グループの一般的な問題のトラブルシューティングと AlwaysOn 可用性グループの監視を開始できます。 元のコンテンツだけでなく他の場所で既にパブリッシュされている有用な情報のランディング ページを提供するものではします。
このガイドは、AlwaysOn 可用性グループを対象となる大きな画面領域で発生する可能性があるすべての問題を説明完全ことはできません、中に、根本原因分析と、問題の解決で正しい方向をポイントできます。 統合テクノロジを AlwaysOn 可用性グループには、発生した問題の多くの他の問題の症状にのみ、データベース システムではします。 いくつかの問題は、中断された可用性データベースなど、可用性グループ内の設定が原因です。 その他の問題は、データベース ファイルの配置、および全社的なパフォーマンスの問題は、可用性グループ、レプリカ、またはデータベースに関連しない問題が SQL Server の設定など、SQL Server の他の側面を分離することができますを含めることができます。 その他の問題もおよびネットワーク I/O、TCP/IP、Active Directory、および Windows Server フェールオーバー クラスタ リング (WSFC) など、SQL Server の外部に存在します。 多くの場合、画面で、可用性グループで、レプリカ、またはデータベース必要があることをルートを特定するには、複数のテクノロジをトラブルシューティングする問題が発生します。
トラブルシューティングのシナリオ
次の表には、AlwaysOn 可用性グループの一般的なトラブルシューティング シナリオへのリンクが含まれています。 これらは、構成、クライアント接続、フェールオーバー、およびパフォーマンスなどのシナリオ型に分類されます。
Scenario | シナリオの種類 | Description |
---|---|---|
AlwaysOn 可用性グループの構成 ( をトラブルシューティングします。SQL Server ) | 構成 | AlwaysOn 可用性グループのサーバー インスタンスの構成に関する一般的な問題のトラブルシューティングに役立つ情報を提供します。 一般的な構成の問題には、AlwaysOn 可用性グループが無効になっている、アカウントが正しく構成されていない、データベース ミラーリング エンドポイントが存在しない、エンドポイントがアクセスできない (SQL Server エラー 1418)、ネットワーク アクセスが存在しないため、データベース参加コマンドが失敗した (SQL Server エラー 35250)。 |
トラブルシューティングを行う"Validating WSFC クォーラム投票の構成"警告 | 構成 | Microsoft SQL Server 2012 では、新しい可用性グループ ウィザードを使用して、AlwaysOn 可用性グループを作成すると、次のような警告メッセージが表示されます:「現在の WSFC クラスター クォーラム投票の構成は推奨されませんこの可用性グループに対する」。 |
可用性グループ リスナーを作成するときに問題をトラブルシューティングします。 | 構成 | 可用性グループ リスナーを作成しようとしているときにエラーが発生します。 |
失敗したファイルの追加操作 ( をトラブルシューティングします。AlwaysOn 可用性グループ ) | 構成 | ファイルの追加操作の原因と、セカンダリ データベースが中断され、NOT SYNCHRONIZING 状態であります。 |
修正: エラー 41009 複数の可用性グループを作成するとき | 構成 | 複数の可用性グループを作成しようとするときは、エラー 41009 を発生します。 |
マルチ サブネット環境で可用性グループ リスナーに接続できません。 | クライアント接続 | 可用性グループ リスナーを構成した後いないリスナーへの ping またはアプリケーションから接続することです。 |
自動フェールオーバーが失敗のトラブルシューティングします。 | [フェールオーバー] | 自動フェールオーバーが正常に完了しませんでした。 |
可用性グループのトラブルシューティング: RTO を超えました | パフォーマンス | 自動フェールオーバーまたは計画的な手動フェールオーバー データ損失なしでは後、は、フェールオーバー時間は、RTO を超えています。 または、(自動フェールオーバー パートナーの場合) などの同期コミット セカンダリ レプリカのフェールオーバーの時間を推計すると、RTO を超えていることがわかります。 |
トラブルシューティング: 可用性グループは RPO を超えています | パフォーマンス | 強制手動フェールオーバーを実行した後、データの損失は、RPO を超えるです。 または、RPO を超えていることを検出する、非同期コミット セカンダリ レプリカのデータ損失の可能性を計算するときにします。 |
トラブルシューティング: プライマリ レプリカでの変更は反映されません、セカンダリ レプリカ | パフォーマンス | クライアント アプリケーションは、プライマリ レプリカの更新プログラムを正常に完了しますが、セカンダリ レプリカのクエリを実行するには、変更が反映されていないことが示されます。 |
トラブルシューティングに役立つツール
構成するか、AlwaysOn 可用性グループを実行している、各種ツールさまざまな種類の問題を診断できます。 次の表は、ツールに有用な情報へのリンクを提供します。
ツール | Description |
---|---|
AlwaysOn ダッシュボードの使用 (SQL Server Management Studio) | 使いやすいインターフェイスでの可用性グループの正常性の概要ビューを報告します。 |
AlwaysOn ポリシー | AlwaysOn ダッシュ ボードによって使用されます。 |
SQL Server エラー ログ & #40 です。AlwaysOn 可用性グループ ) | ログは、可用性グループ、レプリカ、およびデータベース、他の AlwaysOn コンポーネント、および AlwaysOn のエラーの状態遷移イベントを記述します。 |
クラスター化します。ログ & #40 です。AlwaysOn 可用性グループ ) | ログでは、可用性グループ リソースと同様のイベントと SQL Server リソース DLL からのエラーの状態遷移を含むイベントをクラスター化します。 |
AlwaysOn 正常性状態の診断ログ | SQL Server の正常性診断ログに記録によって、WSFC クラスター (SQL Server リソース DLL) に報告されたsp_server_diagnostics & #40 です。TRANSACT-SQL と #41 です。. |
動的管理ビューとシステム カタログ ビュー & #40 です。AlwaysOn 可用性グループ ) | 可用性グループの構成、状態、パフォーマンス メトリックなどに関する情報が報告されます。 |
AlwaysOn の拡張イベント | 根本原因分析のために役立ちますし、可用性グループの詳細な diagnotics を提供します。 |
AlwaysOn の待機の種類 | パフォーマンス チューニングの可用性グループに固有で便利な待機の統計情報を提供します。 |
AlwaysOn パフォーマンス カウンター | AlwaysOn 可用性グループの利用状況の監視であり、システム モニターに反映され、パフォーマンス チューニングの役に立ちます。 詳細については、次を参照してください。 SQL Server、Availability ReplicaとSQL Server、Database Replicaです。 |
AlwaysOn のリング バッファー | 可用性グループに関連する問題をデバッグするために使用して、内部診断の場合、SQL Server システムでアラートを記録します。 |
AlwaysOn 可用性グループの監視
可用性グループのトラブルシューティングに最適なタイミングは、自動または手動かどうか、問題で、フェールオーバー前にです。 これは、可用性グループのパフォーマンス メトリックを監視し、可用性レプリカは、サービス レベル アグリーメント (SLA) の境界の外側を実行しているときにアラートを送信することで実行できます。 たとえば、同期セカンダリ レプリカのパフォーマンスの問題を増やすには、推定フェールオーバー時間が発生する場合は、たくない、自動フェールオーバーが発生し、フェールオーバー時間が、目標の復旧時間を超えることを確認するまで待機します。
AlwaysOn 可用性グループは、高可用性と災害復旧ソリューションには、監視する最も重要なパフォーマンス メトリックは、目標復旧時間 (RTO) と、目標復旧時点 (RPO) の影響を与える災害時にデータ損失の可能性に影響を与える推定フェールオーバー時間。 SQL Server を公開することが警告を表示する、システムの HADR 機能の問題の実際のエラー イベントが発生する前に、どの時点でも、データからこれらのメトリックを収集できます。 そのため、AlwaysOn 可用性グループのデータの同期プロセスの把握、適宜、メトリックを収集することは重要です。
次の表には、AlwaysOn 可用性グループ ソリューションのヘルスを監視するのに役立つトピックへのリンクがあります。
トピック | Description |
---|---|
AlwaysOn 可用性グループのパフォーマンスを監視します。 | 可用性グループを監視するときに、AlwaysOn 可用性グループは、フロー制御ゲートと役立ちますメトリック データの同期処理をについて説明しますRTO と RPO のメトリックを収集する方法についても説明しています。 |
可用性グループ ( の監視SQL Server ) | 可用性グループを監視するためのツールについてを説明します。 |
AlwaysOn の正常性モデル: パート 1: 正常性モデルのアーキテクチャ | AlwaysOn の正常性モデルの概要を示します。 |
AlwaysOn の正常性モデル: パート 2: 正常性モデルの拡張 | AlwaysOn の正常性モデルをカスタマイズして、余分な情報を表示する AlwaysOn ダッシュ ボードをカスタマイズする方法を示します。 |
第 1 部 PowerShell を使用した AlwaysOn 正常性状態の監視: 基本的なコマンドレットの概要 | 可用性グループのヘルスを監視するために使用できる AlwaysOn の PowerShell コマンドレットの基本的な概要を提供します。 |
第 2 部 PowerShell を使用した AlwaysOn 正常性状態を監視しますコマンドレットの使用方法の詳細。 | 可用性グループのヘルスを監視する AlwaysOn PowerShell コマンドレットの高度な使用方法について説明します。 |
パート 3 PowerShell を使用した AlwaysOn 正常性状態の監視: 単純なアプリケーションの監視 | アプリケーションがある可用性グループを自動的に監視する方法を示します。 |
パート 4 PowerShell を使用した AlwaysOn 正常性状態の監視: SQL Server エージェントとの統合 | SQL Server エージェントの可用性グループの監視を統合し、問題が発生したときに、適切なパーティへの通知を構成する方法について説明します。 |