Resource Health を使用して、Azure SQL Database の接続をトラブルシューティングする

適用対象:Azure SQL Database

Azure SQL Database 用の Resource Health は、Azure の問題がお客様のリソースに影響を及ぼしている場合に、診断するためとサポートを受けるために役立ちます。 リソースの現在と過去の正常性に関する情報が表示され、問題を軽減するのに役立ちます。 Azure のサービスの問題についてサポートが必要な場合は、[Resource Health] ページでテクニカル サポートを提供します。

Screenshot of the Azure portal showing the Resource Health page for an Azure SQL Database.

正常性チェック

Resource Health は、リソースへのログインの成功と失敗を調べることで、SQL リソースの正常性を判断します。 現時点では、SQL Database リソース用の Resource Health は、システム エラーによるログインの失敗のみを調べ、ユーザー エラーによる失敗は調べません。 正常性の状態は、1 - 2 分ごとに更新されます。

正常性状態

利用可能

[使用可能] の状態は、SQL データベースのシステム エラーが原因で Resource Health がログイン エラーを検出しなかったか、ログイン エラーが発生したけれどもアラートのしきい値を満たさなかったことを意味します。 以下のセクションでは、アラートのしきい値の詳細情報を説明します。

Screenshot of the Azure portal showing the status message for the state of Available.

低下しています

[低下] の状態は、過去 3 分間のうち 2 分間に Resource Health が以下を検出したことを意味します:

  • 大部分がログインに成功していたけれども、(システム エラーが原因で) 複数のログイン エラーが発生していた、または
  • (システム エラーが原因で) 複数のログインエラーが発生していたけれども、ログイン試行回数は 6 回未満だった。

それらは、多くの場合、一時的なログイン エラーです。 一時的なログイン エラーによって発生する接続の問題点の影響を減らすために、コード内に再試行ロジックを実装してください。

Screenshot of the Azure portal showing the status message for the state of Degraded.

利用不可

[使用不可] の状態は、Resource Health が最後の 1 分間に 5 回を超えるログイン試行があり、そのうちの 4 分の 1 以上がシステム上の理由で失敗していることを検出したことを意味します。 リソースが長期間この状態のままである場合は、Microsoft サポートに問い合わせてください。

Screenshot of the Azure portal showing the status message for the state of Unavailable.

Unknown

[不明] という状態は、Resource Health がこのリソースに関する情報を 10 分以上受け取っていないことを示します。 この状態はリソースの状態を明確に示すものではありませんが、トラブルシューティング プロセスにおいて重要なデータ ポイントです。 リソースが想定したとおりに実行されている場合、リソースの状態は数分後に [使用可能] に変わります。 リソースで問題が発生している場合、[不明]の正常性状態は、プラットフォーム内のイベントによってリソースが影響を受けていることを示唆している可能性があります。

Screenshot of the Azure portal showing the status message for the state of Unknown.

アラート時間

Resource Health のアラートによって表示される時間は、アラートの原因となったログイン エラーの時間と一緒に表示されません。 これは、テレメトリが収集されて分析され、Resource Health の問題が発生したと判断するまでに数分かかるためです。 そのため、Resource Health のアラートに示されている時間は、ログイン エラーの数分後になります。

さらに、ログイン エラーが発生した期間は、多くの場合、Resource Health のアラートの期間よりも短くなる可能性があります。

履歴情報

Resource Health[正常性の履歴] セクションで、最大 30 日間の正常性履歴にアクセスできます。 セクションには、ダウンタイムの発生理由 (入手可能な場合) も含まれます。 現時点では、Azure では、2 分の細分性でデータベース リソースのダウンタイムが表示されます。 実際のダウンタイムは、多くの場合、1 分未満です。 平均は 8 秒です。

ダウンタイムの理由

お使いのデータベースでダウンタイムが発生すると、理由を判断するための分析が実行されます。 入手可能な場合、Resource Health[正常性の履歴] セクションにダウンタイムの理由が報告されます。 ダウンタイムの理由は、通常、イベント後 45 分以内に公開されます。

メンテナンス期間を選択する

影響を与えるメンテナンス イベントを予測可能にし、ワークロードへの影響を影響を軽減するようにメンテナンス期間を構成できます。 メンテナンス ウィンドウ機能は、予測可能なアップグレードまたはスケジュールされたメンテナンスの計画に役立ちます。 事前通知は、既定でないメンテナンス期間を使用するように構成されたデータベースで使用できます。 事前通知を使用すると、顧客は、計画されたイベントの 24 時間前までに通知が送信されるように構成できます。

Azure の計画メンテナンス

Azure インフラストラクチャでは、計画メンテナンス (データセンター内のハードウェアまたはソフトウェア コンポーネントのアップグレード) が定期的に実行されます。 データベースのメンテナンスが実行されている間、Azure SQL によっていくつかの既存の接続が終了され、新しい接続が拒否される可能性があります。 計画メンテナンス中に発生するログイン の失敗は、通常は一時的なものです。時折発生するネットワーク エラー時に対応する再試行ロジックは影響を軽減するのに役立ちます。 ログイン エラーの発生が続く場合は、サポートに問い合わせてください。

Reconfiguration

再構成は一時的な状態であると考えられ、ときどき発生することが想定されます。 これらのイベントは、負荷分散やソフトウェア/ハードウェア障害によってトリガーされる可能性があります。 クラウド データベースに接続するクライアントの運用アプリケーションでは、堅牢な接続一時的なエラーに対する再試行ロジックを実装する必要があります。それによって状況が緩和され、通常はエンド ユーザーにとってエラーが透過的になります。