Resource Health を使用して、Azure SQL Database の接続をトラブルシューティングする

[アーティクル]
01/09/2024

Azure SQL Database 用の Resource Health は、Azure の問題がお客様のリソースに影響を及ぼしている場合に、診断するためとサポートを受けるために役立ちます。リソースの現在と過去の正常性に関する情報が表示され、問題を軽減するのに役立ちます。 Azure のサービスの問題についてサポートが必要な場合は、[Resource Health] ページでテクニカルサポートを提供します。

正常性チェック

Resource Health は、リソースへのログインの成功と失敗を調べることで、SQL リソースの正常性を判断します。現時点では、SQL Database リソース用の Resource Health は、システムエラーによるログインの失敗のみを調べ、ユーザーエラーによる失敗は調べません。正常性の状態は、1 - 2 分ごとに更新されます。

正常性状態

利用可能

[使用可能] の状態は、SQL データベースのシステムエラーが原因で Resource Health がログインエラーを検出しなかったか、ログインエラーが発生したけれどもアラートのしきい値を満たさなかったことを意味します。以下のセクションでは、アラートのしきい値の詳細情報を説明します。

低下している

[低下] の状態は、過去 3 分間のうち 2 分間に Resource Health が以下を検出したことを意味します:

大部分がログインに成功していたけれども、(システムエラーが原因で) 複数のログインエラーが発生していた、または
(システムエラーが原因で) 複数のログインエラーが発生していたけれども、ログイン試行回数は 6 回未満だった。

それらは、多くの場合、一時的なログインエラーです。一時的なログインエラーによって発生する接続の問題点の影響を減らすために、コード内に再試行ロジックを実装してください。

設定しています

[使用不可] の状態は、Resource Health が最後の 1 分間に 5 回を超えるログイン試行があり、そのうちの 4 分の 1 以上がシステム上の理由で失敗していることを検出したことを意味します。リソースが長期間この状態のままである場合は、Microsoft サポートに問い合わせてください。

Unknown

[不明] という状態は、Resource Health がこのリソースに関する情報を 10 分以上受け取っていないことを示します。この状態はリソースの状態を明確に示すものではありませんが、トラブルシューティングプロセスにおいて重要なデータポイントです。リソースが想定したとおりに実行されている場合、リソースの状態は数分後に [使用可能] に変わります。リソースで問題が発生している場合、[不明]の正常性状態は、プラットフォーム内のイベントによってリソースが影響を受けていることを示唆している可能性があります。

アラート時間

Resource Health のアラートによって表示される時間は、アラートの原因となったログインエラーの時間と一緒に表示されません。これは、テレメトリが収集されて分析され、Resource Health の問題が発生したと判断するまでに数分かかるためです。そのため、Resource Health のアラートに示されている時間は、ログインエラーの数分後になります。

さらに、ログインエラーが発生した期間は、多くの場合、Resource Health のアラートの期間よりも短くなる可能性があります。

履歴情報

Resource Health の [正常性の履歴] セクションで、最大 30 日間の正常性履歴にアクセスできます。セクションには、ダウンタイムの発生理由 (入手可能な場合) も含まれます。現時点では、Azure では、2 分の細分性でデータベースリソースのダウンタイムが表示されます。実際のダウンタイムは、多くの場合、1 分未満です。平均は 8 秒です。

ダウンタイムの理由

お使いのデータベースでダウンタイムが発生すると、理由を判断するための分析が実行されます。入手可能な場合、Resource Health の [正常性の履歴] セクションにダウンタイムの理由が報告されます。ダウンタイムの理由は、通常、イベント後 45 分以内に公開されます。

メンテナンス期間を選択する

影響を与えるメンテナンスイベントを予測可能にし、ワークロードへの影響を影響を軽減するようにメンテナンス期間を構成できます。メンテナンスウィンドウ機能は、予測可能なアップグレードまたはスケジュールされたメンテナンスの計画に役立ちます。事前通知は、既定でないメンテナンス期間を使用するように構成されたデータベースで使用できます。事前通知を使用すると、顧客は、計画されたイベントの 24 時間前までに通知が送信されるように構成できます。

Azure の計画メンテナンス

Azure インフラストラクチャでは、計画メンテナンス (データセンター内のハードウェアまたはソフトウェアコンポーネントのアップグレード) が定期的に実行されます。データベースのメンテナンスが実行されている間、Azure SQL によっていくつかの既存の接続が終了され、新しい接続が拒否される可能性があります。計画メンテナンス中に発生するログインの失敗は、通常は一時的なものです。時折発生するネットワークエラー時に対応する再試行ロジックは影響を軽減するのに役立ちます。ログインエラーの発生が続く場合は、サポートに問い合わせてください。

Reconfiguration

再構成は一時的な状態であると考えられ、ときどき発生することが想定されます。これらのイベントは、負荷分散やソフトウェア/ハードウェア障害によってトリガーされる可能性があります。クラウドデータベースに接続するクライアントの運用アプリケーションでは、堅牢な接続一時的なエラーに対する再試行ロジックを実装する必要があります。それによって状況が緩和され、通常はエンドユーザーにとってエラーが透過的になります。

次の方法で共有

Resource Health を使用して、Azure SQL Database の接続をトラブルシューティングする

正常性チェック

正常性状態