メトリックとアラートを使用して Azure SQL Database を監視する

2025-02-11

Azure Monitor メトリックを使用して、データベースとエラスティックプールのリソースの消費量と正常性を監視できます。メトリック値が潜在的な問題を示している場合は、アラートを使用して通知を送信できます。

メトリック

メトリックは、一定の期間で測定される一連の数値です。多くの場合、単位 (count、percent、bytesなど) を使用します。メトリックの性質に応じて、集計 (total、count、average、minimum、maximumなど) を使用して、一定期間にわたってメトリック値を計算できます。一部のメトリックはディメンションごとに分割できます。各次元は、数値に追加のコンテキストを提供します。

使用可能な Azure SQL Database メトリックの例を次に示します: CPU percentage、Data space used、Deadlocks、Tempdb Percent Log Used。

Azure SQL Database で使用可能なすべてのメトリックについては、データベースメトリックスとエラスティックプールメトリックを参照してください。

注

一部のメトリックは、特定の種類のデータベースまたはエラスティックプールにのみ適用されます。特定のデータベースやエラスティックプールの種類（仮想コア、Hyperscale、サーバーレスなど）への使用が制限されている場合は、その旨が各メトリックの説明に記載されています。

Azure SQL Database ポータルでは、[概要] ページの [監視] タブに一般的に使用されるメトリックがいくつかグラフ化されています。このメトリックにより、データベースまたはエラスティックプールのリソース消費量と正常性をひとめで評価できます。

[主要なメトリック] で、[すべてのメトリックスを表示] またはグラフ内の任意の場所を選択してメトリックスエクスプローラーを開きます。 [メトリックス] ページでは、データベースまたはエラスティックプールリソースで使用可能な他のすべてのメトリックスを表示できます。メトリックスエクスプローラーでは、グラフの時間の範囲、粒度、集計の種類を変更したり、グラフの種類を変更したり、他の Azure リソースからのメトリックを含むようにスコープを展開したり、アラートルールを作成したりできます。ソースメニューの [監視] の [メトリックス] メニュー項目を選択してメトリックスエクスプローラーを開くこともできます。

メトリックスを使用してデータベースとエラスティックプールを監視する

メトリックスを使用して、データベースとエラスティックプールのリソースの消費量と正常性を監視できます。たとえば、次のようなことができます。

アプリケーションワークロードに合わせてデータベースまたはエラスティックプールのサイズを適切に設定する
リソース消費量の段階的な増加を検出し、データベースまたはエラスティックプールを事前にスケールアップする
パフォーマンスの問題を検出しトラブルシューティングする

次の表では、Azure SQL Database でよく使用されるメトリックスについて説明します。

メトリックの名前	メトリック ID	説明
CPU 使用率	`cpu_percent`	このメトリックは、データベースまたはエラスティックプールのユーザーワークロード制限に対する CPU 消費量をパーセンテージで示します。詳細については、「ユーザーワークロードと内部プロセスによるリソース使用量」を参照してください。
SQL インスタンスの CPU 使用率	`sql_instance_cpu_percent`	このメトリックは、ユーザーとシステムのワークロードによる CPU 消費量の合計をパーセンテージで示します。このメトリックと CPU 使用率メトリックは異なるスケールで測定されるため、互いに直接比較することはできません。詳細については、「ユーザーワークロードと内部プロセスによるリソース使用量」を参照してください。
データ IO の割合	`physical_data_read_percent`	このメトリックは、データベースまたはエラスティックプールのユーザーワークロード制限に対するデータファイル IO 消費量をパーセンテージで示します。詳細については、「データ IO ガバナンス」に関するページを参照してください。
ログ IO の割合	`log_write_percent`	このメトリックは、データベースまたはエラスティックプールのユーザーワークロード制限に対するトランザクションログ書き込みスループットの消費量をパーセンテージで示します。詳細については、「トランザクションログ速度ガバナンス」を参照してください。
ワーカーの割合	`workers_percent`	このメトリックは、データベースまたはエラスティックプールのユーザーワークロード制限に対するワーカースレッドの消費量をパーセンテージで示します。
DTU の割合	`dtu_consumption_percent`	このメトリックは、データベースまたはエラスティックプールのユーザーワークロード制限に対する DTU 消費量をパーセンテージで示します。 DTU の割合は、CPU の割合、データ IO の割合、およびログ IO の割合という他の 3 つのメトリックから得られます。任意の時点で、DTU の割合は、これら 3 つのメトリックの中で最も高い値と一致します。
使用された CPU	`cpu_used`	このメトリックは、データベースまたはエラスティックプールのユーザーワークロード制限に対する CPU 消費量を仮想コアの数として表します。詳細については、「Azure SQL Database での高い CPU の診断とトラブルシューティング」を参照してください。
使用された DTU	`dtu_used`	このメトリックは、データベースまたはエラスティックプールで使用される DTU の数を示します。
アプリの CPU 課金	`app_cpu_billed`	サーバーレスデータベースの場合、このメトリックは課金されるコンピューティング (CPU とメモリ) の量を仮想コア秒数で示します。詳細については、「サーバーレスコンピューティングレベルでの課金」を参照してください。
アプリ CPU の割合	`app_cpu_percent`	サーバーレスデータベースの場合、このメトリックは、アプリパッケージの最大仮想コア制限に対する CPU 消費量をパーセンテージで示します。詳細については、「サーバーレスコンピューティングレベルでの監視」を参照してください。
アプリメモリの割合	`app_memory_percent`	サーバーレスデータベースの場合、このメトリックは、アプリパッケージの最大メモリ制限に対するメモリ消費量をパーセンテージで示します。詳細については、「サーバーレスコンピューティングレベルでの監視」を参照してください。
Sessions count (セッション数)	`sessions_count`	このメトリックは、データベースまたはエラスティックプールに対して確立されたユーザーセッションの数を示します。
使用済みのデータ領域	`storage`	データベースの場合、このメトリックは、データベースのデータファイルで使用される記憶域スペースの量を示します。
使用済みのデータ領域	`storage_used`	エラスティックプールの場合、このメトリックは、エラスティックプール内のすべてのデータベースのデータファイルで使用される記憶域スペースの量を示します。
割り当て済みのデータ領域	`allocated_data_storage`	このメトリックは、データベースのデータファイルまたはエラスティックプール内のすべてのデータベースのデータファイルによって占有される記憶域スペースの量を示します。データファイルには空のスペースが含まれている場合があります。このため、割り当てられるデータスペースは、同じデータベースまたはエラスティックプールに使用されるデータスペースよりも多くなること多いです。詳細については、「Manage file space for databases in Azure SQL Database」(Azure SQL Database でデータベースのファイルスペースを管理する) を参照してください。
使用済みのデータスペースの割合	`storage_percent`	データベースの場合、このメトリックは、データベースのデータサイズ制限に対するデータベースのデータファイルで使用される記憶域スペースの量を示します。エラスティックプールの場合、エラスティックプール内のすべてのデータベースのデータファイルで使用される記憶域スペースの量が、エラスティックプールのデータサイズ制限に対する割合で表されます。データベースまたはエラスティックプールのデータサイズ制限が、最大データサイズ制限より低く構成されている可能性があります。最大データサイズの制限については、仮想コアデータベース、仮想コアエラスティックプール、DTU データベース、DTU エラスティックプールのリソース制限に関するページを参照してください。
割り当て済みのデータスペースの割合	`allocated_data_storage_percent`	エラスティックプールの場合、このメトリックは、エラスティックプール内のすべてのデータベースのデータファイルによって占有される記憶域スペースの量を、プールのデータサイズ制限に対してパーセンテージで示します。
Tempdb ログ使用率	`tempdb_log_used_percent`	このメトリックは、最大ログサイズに対する `tempdb` データベース内のトランザクションログスペースの使用量をパーセンテージで示します。詳細については、「Azure SQL Database の tempdb」を参照してください。
成功した接続	`connection_successful`	このメトリックは、データベースへの接続が正常に確立された数を示します。このメトリックは、2つの次元、`SslProtocol` と `ValidatedDriverNameAndVersion` によって分割し、特定の暗号化プロトコルのバージョンまたは特定のクライアントドライバーを使用して接続数を確認できます。
失敗した接続: システムエラー	`connection_failed`	このメトリックは、内部サービスエラーが原因で失敗したデータベースへの接続試行回数を示します。最も一般的に、このようなエラーは一時的なものです。このメトリックは、`Error` と `ValidatedDriverNameAndVersion` の2つの次元で分割することにより、特定のエラーや特定のクライアントドライバーによって接続試行が失敗した回数を確認できます。
失敗した接続: ユーザーエラー	`connection_failed_user_error`	このメトリックは、パスワードが正しくない、ファイアウォールによって接続がブロックされているなど、ユーザーが修正可能なエラーのために失敗したデータベースへの接続試行回数を示します。このメトリックは、`Error` と `ValidatedDriverNameAndVersion` の2つの次元で分割することにより、特定のエラーや特定のクライアントドライバーによって接続試行が失敗した回数を確認できます。
デッドロック	`deadlock`	このメトリックは、データベース内のデッドロック状態の数を示します。
可用性	`availability`	可用性は、接続に対して動作しているデータベースに基づいて決定されます。 1 分間のデータポイントごとに、使用可能な値は `100%` か `0%` のいずれかです。詳細については、可用性のメトリックに関するページをご覧ください。

可用性のメトリック

可用性メトリックは、個々の Azure SQL データベースレベルで可用性を追跡します。

可用性は、接続停止の 1 分間に細かく設定されます。可用性は、接続に対して動作しているデータベースに基づいて決定されます。データベースへの接続の確立を 1 分間連続して試行し、サービスの問題ですべての試行が失敗した場合、そのデータベースは 1 分間ダウンタイムだったか使用できなかったとみなされます。一時的な利用不可がある場合、継続的な利用不可の期間が1分を超えた場合にダウンタイムとして見なされます。通常、可用性を表示する待機時間は 3 分未満です。

1 分サイクル間隔ごとに可用性を計算するために使用されるロジックを次に示します。

接続に成功した接続が 1 つ以上ある場合、可用性は 100% になります。
ユーザーエラーが原因ですべての接続が失敗した場合、可用性は 100% になります。
接続試行がない場合、可用性は 100% です。
システムエラーが原因ですべての接続が失敗した場合、可用性は 0% になります。
現時点では、可用性メトリックデータはサーバーレスコンピューティングレベルではサポートされておらず、100%表示されます。

したがって、可用性メトリックは、次の既存のメトリックから派生した複合メトリックです。

成功した接続
失敗した接続: ユーザーエラー
ファイアウォールによってブロックされる
失敗した接続: システムエラー

ユーザーエラーには、ユーザーの構成、ワークロード、または管理のために失敗したすべての接続が含まれます。システムエラーには、Azure SQL データベースサービスに関連する一時的な問題が原因で失敗したすべての接続が含まれます。

ユーザー構成によって発生するエラーの例:
ユーザーワークロードによって発生するエラーの例:
- リソースガバナンスによる接続失敗
ユーザー管理によって発生するエラーの例:
- データベースまたは Elastic Pool のスケールアップまたはスケールダウン
- geo レプリケーションの計画されたフェールオーバーまたは強制フェールオーバー
- フェールオーバーグループの計画されたフェールオーバーまたは強制フェールオーバー
- シード処理状態の geo セカンダリデータベース
- ポイントインタイムリストア (PITR)、長期復元 (LTR)、または削除されたデータベースからの復元が原因で復元状態にあるデータベース
- まだコピーが完了していないデータベース (データベースコピー)

警告

アラートルールを作成して、1 つのメトリックまたは複数のメトリックスの値が想定範囲外であることを通知できます。

アラートルールの範囲は、ニーズに合わせて複数の方法で設定できます。たとえば、アラートルールの範囲は次のように設定できます。

単一データベース
エラスティックプール
リソースグループ内のすべてのデータベースまたはエラスティックプール
Azure リージョン内のサブスクリプションのすべてのデータベースまたはエラスティックプール
すべてのリージョン内のサブスクリプション内のすべてのデータベースまたはエラスティックプール

アラートルールは、ルックバック期間中に集計メトリック値を定期的に評価し、しきい値と比較します。しきい値、評価頻度、およびルックバック期間を構成できます。

アラートルールがトリガーされると、通知設定に従って通知されます。通知設定は、アラートルールにリンクされているアクショングループで指定します。たとえば、メール、SMS、音声通知を受信できます。アラートルールでは、Webhook、Automation Runbook、FUNCTION、ロジックアプリなどのアクションをトリガーすることもできます。アラートは、サポートされている IT サービスマネジメント製品と統合できます。

Azure Monitor のアラートについて詳しくは、「Azure Monitor のアラートの概要」に関するページをご覧ください。メトリックアラートを理解するには、メトリックアラート、アラートルールの管理、アクショングループを確認します。

推奨されるアラートルール

アラートルールで使用するメトリックと最適なしきい値は、Azure SQL Database のさまざまな顧客のワークロードによって異なります。

次の表の推奨されるアラートは、Azure SQL Database リソースに最適なアラート構成を定義するのに役立つ開始点です。要件によっては、構成がこの例と異なる場合があります。さまざまなしきい値、評価頻度、またはルックバック期間を使用できます。追加のアラートを作成することも、異なるアプリケーションや環境に対して異なるアラートルール構成を使用することもできます。

一般的なアラートルールの構成の例を次に示します。

アラートルール名	メトリック (信号)	アラートロジック	評価するタイミング	推奨される重大度
ユーザー CPU 使用率が高い	CPU 使用率	しきい値: `Static` 集計: `Average` 演算子: `Greater than` しきい値: `90`	すべてのチェック: `1 minute` ルックバック期間: `10 minutes`	2- 警告
CPU 使用率の合計が高い	SQL インスタンスの CPU 使用率	しきい値: `Static` 集計: `Average` 演算子: `Greater than` しきい値: `90`	すべてのチェック: `1 minute` ルックバック期間: `10 minutes`	2- 警告
ワーカーの使用率が高い	ワーカーの割合	しきい値: `Static` 集計: `Minimum` 演算子: `Greater than` しきい値: `60`	すべてのチェック: `1 minute` ルックバック期間: `5 minutes`	1 - エラー
高いデータ IO 使用量	データ IO の割合	しきい値: `Static` 集計: `Average` 演算子: `Greater than` しきい値: `90`	すべてのチェック: `1 minute` ルックバック期間: `15 minutes`	3 ‐ 情報提供
データスペースが少ない	使用済みのデータスペースの割合	しきい値: `Static` 集計: `Minimum` 演算子: `Greater than` しきい値: `95`	すべてのチェック: `15 minute` ルックバック期間: `15 minutes`	1 - エラー
`tempdb` のログスペースが不足しています	Tempdb ログ使用率	しきい値: `Static` 集計: `Minimum` 演算子: `Greater than` しきい値: `60`	すべてのチェック: `1 minute` ルックバック期間: `5 minutes`	1 - エラー
デッドロック	デッドロック	しきい値: `Dynamic` 集計:`Total` 演算子: `Greater than` しきい値の感度: `Medium`	すべてのチェック: `15 minutes` ルックバック期間: `1 hour`	3 ‐ 情報提供
失敗した接続 (ユーザーエラー)	失敗した接続: ユーザーエラー	しきい値: `Dynamic` 集計:`Total` 演算子: `Greater than` しきい値の感度: `Medium`	すべてのチェック: `5 minutes` ルックバック期間: `15 minutes`	2- 警告
失敗した接続 (システムエラー)	失敗した接続: システムエラー	しきい値: `Static` 集計: `Total` 演算子: `Greater than` 単位: `Count` しきい値: `10`	すべてのチェック: `1 minute` ルックバック期間: `5 minutes`	2- 警告
異常な接続速度	成功した接続	しきい値: `Dynamic` 集計:`Total` 演算子: `Greater or Less than` しきい値の感度: `Low`	すべてのチェック: `5 minutes` ルックバック期間: `15 minutes`	2- 警告

推奨されるアラートルールの一部では、動的しきい値を使用して、注意が必要になる可能性がある異常なメトリックパターンを検出します。動的しきい値に基づくアラートルールは、通常のパターンを確立するために十分な履歴データが収集されるまでトリガーされません。詳細については、「メトリックアラートでの動的しきい値」を参照してください。

既定では、メトリックアラートはステートフルです。つまり、アラートルールがトリガーされると、アラートは 1 回だけ発生します。アラートは解決されるまで fired 状態に残り、その時点で resolved 通知が送信されます。アラートルールは、前のアラートが解決された後にのみ新しいアラートをトリガーします。ステートフルアラートは、継続的な状態に関する頻繁な通知を回避します。ステートフルアラートとステートレスアラートの詳細については、「アラートと状態」を参照してください。

次の方法で共有

メトリックとアラートを使用して Azure SQL Database を監視する