SQL Hyperscale のパフォーマンスのトラブルシューティング診断

適用対象:Azure SQL データベース

Hyperscale データベースのパフォーマンスの問題をトラブルシューティングするために、一般的な SQL パフォーマンスチューニング手法は、パフォーマンス調査の開始点です。ただし、Hyperscale の分散アーキテクチャを考慮して、追加の診断データを検討する必要があることがあります。この記事では、Hyperscale 固有の診断データについて説明します。

ログレートの待機時間の短縮

Azure SQL Database 内のすべてのデータベースとエラスティックプールは、ログレートガバナンス使用してログ生成率を管理します。ログレートの制限は、sys.dm_user_db_resource_governanceの primary_max_log_rate列で公開されます。

場合によっては、回復性サービスレベルアグリーメント (SLA) を維持するために、プライマリコンピューティングレプリカのログ生成率を下げる必要があります。たとえば、ページサーバーまたは別のコンピューティングレプリカが、ログサービスから新しいログレコードを適用するかなり遅れている場合に発生する可能性があります。ハイパースケールコンポーネントが背後に存在しない場合、ログレートガバナンスメカニズムにより、Premium シリーズおよび Premium シリーズのメモリ最適化ハードウェアの場合、ログ生成速度はデータベースあたり 150 MiB/秒に達します。 Standard シリーズハードウェアの場合、最大ログレートはデータベースあたり 100 MiB/秒です。エラスティックプールの場合、最大ログレートは、Premium シリーズおよび Premium シリーズメモリ最適化ハードウェアの場合はプールあたり 150 MiB/秒、他のハードウェアの場合はプールあたり 125 MiB/秒です。

ログレートが低下すると、sys.dm_os_wait_stats に次の待機の種類が表示されます。

待機の種類	理由
`RBIO_RG_STORAGE`	ページサーバーによるログ使用の遅延
`RBIO_RG_DESTAGE`	長期ログストレージによるログ消費の遅延
`RBIO_RG_REPLICA`	HA セカンダリレプリカまたは名前付きレプリカによるログ使用の遅延
`RBIO_RG_GEOREPLICA`	ジオセカンダリレプリカによるログ使用の遅延
`RBIO_RG_DESTAGE`	ログサービスによるログの処理の遅延
`RBIO_RG_LOCALDESTAGE`	ログサービスによるログの処理の遅延
`RBIO_RG_STORAGE_CHECKPOINT`	データベースチェックポイントが遅いため、ページサーバーによるログの使用が遅い
`RBIO_RG_MIGRATION_TARGET`	逆移行中の Hyperscale 以外のデータベースによるログの使用の遅延

sys.dm_hs_database_log_rate() 動的管理機能 (DMF) には、ログレートの低下 (ある場合) を理解するのに役立つ詳細が用意されています。たとえば、ログレコードの適用の背後にある特定のセカンダリレプリカと、まだ適用されていないトランザクションログの合計サイズを確認できます。

ページサーバーの読み取り

コンピューティングレプリカは、データベースの完全なコピーをローカルにキャッシュしません。コンピューティングレプリカに対してローカルなデータは、バッファープール (メモリ内) と、最も頻繁にアクセスされるデータページのサブセットを含むローカル回復性バッファープール拡張機能 (RBPEX) キャッシュに格納されます。このローカル SSD キャッシュは、コンピューティングサイズに比例してサイズ設定されます。一方、各ページサーバーには、保持するデータベースの一部に対する完全な SSD キャッシュがあります。

コンピューティングレプリカで読み取り IO が発行されると、データがバッファープールまたはローカル SSD キャッシュに存在しない場合、要求されたログシーケンス番号 (LSN) のページが、対応するページサーバーからフェッチされます。ページサーバーからの読み取りはリモートであり、ローカル SSD キャッシュからの読み取りよりも低速です。 I/O 関連のパフォーマンスの問題をトラブルシューティングする場合は、比較的低速なページサーバー読み取りを使用して実行された IO の数を確認できる必要があります。

いくつかの DMV (Dynamic Managed View) および拡張イベントには、ページサーバーからのリモート読み取りの数を指定する列とフィールドがあり、この数を合計読み取り数と比較できます。クエリストアでは、クエリランタイム統計でページサーバーの読み取りもキャプチャされます。

ページサーバーの読み取りを報告するための列は、実行DMVおよびカタログビューで利用可能です。
ページサーバーの読み取りフィールドは、次の拡張イベントに存在します。
- sql_statement_completed
- sp_statement_completed
- sql_batch_completed
- rpc_completed
- scan_stopped
- query_store_begin_persist_runtime_stat
- query_store_execution_runtime_info
ActualPageServerReads / ActualPageServerReadAheads 属性は、ランタイム統計を含むプランのクエリプラン XML に存在します。例えば次が挙げられます。
```
<RunTimeCountersPerThread Thread="8" ActualRows="90466461" [...] ActualPageServerReads="0" ActualPageServerReadAheads="5687297" ActualLobPageServerReads="0" ActualLobPageServerReadAheads="0" />
```
ヒント

クエリプランのプロパティウィンドウでこれらの属性を表示するには、SSMS 18.3 以降が必要です。

仮想ファイルの統計と IO アカウンティング

Azure SQL Database では、sys.dm_io_virtual_file_stats() DMF は、IOPS、スループット、待機時間などのデータベース I/O 統計を監視する 1 つの方法です。 Hyperscale の I/O 特性は、分散アーキテクチャのにより異なります。このセクションでは、この DMF で見られるように、読み取りと書き込みの I/O に焦点を当てます。

Hyperscale の場合、 sys.dm_io_virtual_file_stats() の関連データは次のとおりです。

database_id値がDB_ID関数によって返される値と一致し、file_id値が 2 以外である行は、ページサーバーに対応します。通常、各行は 1 つのページサーバーに対応します。ただし、大きなファイルの場合は、複数のページサーバーが使用されます。
- file_id 2 の行は、トランザクションログに対応します。
database_id列の値が 0 の行は、コンピューティングレプリカ上のローカル SSD キャッシュに対応します。

ローカル SSD キャッシュの使用状況

ローカル SSD キャッシュは、データベースエンジンがクエリを処理しているのと同じコンピューティングレプリカ上に存在するため、このキャッシュに対する I/O はページサーバーに対する I/O よりも高速です。 Hyperscale データベースまたはエラスティックプールでは、 sys.dm_io_virtual_file_stats() には、ローカル SSD キャッシュの I/O 統計を報告する特別な行があります。これらの行には、database_id列の0という値があります。たとえば、次のクエリは、データベースの起動以降のローカル SSD キャッシュ I/O 統計を返します。

SELECT *
FROM sys.dm_io_virtual_file_stats(0, NULL);

ローカル SSD キャッシュファイルからの集計読み取りと他のすべてのデータファイルからの集計読み取りの比率は、ローカル SSD キャッシュヒット率です。このメトリックは、RBPEX cache hit ratio DMV で使用できる RBPEX cache hit ratio base およびパフォーマンスカウンターによって提供されます。

データ読み取り

データベースエンジンがコンピュートレプリカ上で読み取りを発行する際、ローカルSSDキャッシュやページサーバー、または複数ページの読み取り時にはそれら二つの組み合わせから提供される可能性があります。
コンピューティングレプリカが特定のデータファイル (たとえば、 file_id 1 のファイル) からいくつかのページを読み取る場合、このデータがローカル SSD キャッシュにのみ存在する場合、この読み取りのすべての IO は、 database_id が 0 であるローカル SSD キャッシュファイルに対して考慮されます。そのデータの一部がローカル SSD キャッシュにあり、一部がページサーバー上にある場合、IO はローカル SSD キャッシュファイルに対して部分的に、一部はページサーバーに対応するデータファイルに対して考慮されます。
コンピューティングレプリカがページサーバーから特定の LSN のページを要求した場合、ページサーバーが要求した LSN にまだ追いついていない場合、コンピューティングレプリカの読み取りは、ページサーバーがキャッチアップするまで待機してからページが返されます。コンピューティングレプリカ上のページサーバーからの読み取りでは、その IO を待機している場合は、 PAGEIOLATCH_* 待機の種類が表示されます。 Hyperscale では、この待機時間には、ページサーバー上の要求されたページを必要なLSNに追いつくための時間と、ページサーバーからコンピューティングレプリカにページを転送するために必要な時間の両方が含まれます。
先読みなどの大規模な読み取り操作は、多くの場合、散布・収集読み取り技術を使用して行われます。これにより、1 回の読み取り IO として最大 4 MB の読み取りが可能になります。ただし、読み取るデータがローカル SSD キャッシュにある場合、バッファープールとローカル SSD キャッシュでは常に 8 KB のページが使用されるため、これらの読み取りは複数の個別の 8 KB 読み取りとして考慮されます。その結果、ローカル SSD キャッシュに対して表示される読み取り IO の数が、エンジンによって実行された IO の実際の数よりも多くなることがあります。

データ書き込み

プライマリコンピューティングレプリカは、ページサーバーに直接書き込まれません。代わりに、ログサービスのログレコードは、対応するページサーバーで再生されます。
コンピューティングレプリカでの書き込みは、主にローカル SSD キャッシュ (database_id 0) に書き込まれます。 8 KB を超える書き込みの場合、つまり、の収集/書き込みを使用して行われた書き込み操作は、バッファープールとローカル SSD キャッシュが常に 8 KB ページを使用するため、ローカル SSD キャッシュへの複数の 8 KB の個々の書き込みに変換されます。その結果、ローカル SSD キャッシュに対して表示される書き込み IO の数が、エンジンによって実行された IO の実際の数よりも多くなることがあります。
ページサーバーに対応する database_id 0 以外のデータファイルにも書き込みが表示される場合があります。 Hyperscale では、コンピューティングレプリカがページサーバーに直接書き込むことはありませんので、これらの書き込みがシミュレートされます。 I/O 統計は、コンピュートレプリカで発生した際に記録されます。 database_id 0 以外のデータファイルのコンピューティングレプリカで見られる書き込み IOPS、スループット、待機時間は、ページサーバーで発生した書き込みの実際の I/O 統計を反映していません。

ログ書き込み

プライマリコンピューティングレプリカでは、sys.dm_io_virtual_file_stats() 2 の下のfile_idでログの書き込みが考慮されます。
可用性グループとは異なり、プライマリコンピューティングレプリカでトランザクションがコミットされると、ログレコードはセカンダリレプリカで強化されません。 Hyperscale では、ログはログサービスで強化され、セカンダリレプリカに非同期的に適用されます。ログの書き込みは実際にはセカンダリレプリカでは行われませんので、セカンダリレプリカの sys.dm_io_virtual_file_stats() のログ IO をトランザクションログ I/O 統計として使用しないでください。

リソース使用率の統計でのデータ IO

ハイパースケール以外のデータベースでは、リソースガバナンスデータ IO 制限に関連するデータファイルに対する読み取りと書き込みの IOPS の組み合わせが、列のsys.dm_db_resource_statsビューとavg_data_io_percent ビューで報告されます。エラスティックプールに対応する DMV は、sys.dm_elastic_pool_resource_stats と sys.elastic_pool_resource_statsです。データベースとエラスティックプールの Azure Monitor メトリックとして、データ IO 割合と と同じ値が報告されます。

Hyperscale データベースでは、これらの列とメトリックは、コンピューティングレプリカ上のローカル SSD ストレージの制限 (ローカル SSD キャッシュと tempdb データベースに対する I/O を含む) に対するデータ IO 使用率に関して報告します。この列の100% 値は、リソースガバナンスがローカルストレージの IOPS を制限していることを示します。これがパフォーマンスの問題と関連している場合は、ワークロードを調整して生成する IO を減らすか、コンピューティングサイズを大きくして、最大データ IOPS制限リソースガバナンスを増やします。ローカル SSD キャッシュの読み取りと書き込みのリソースガバナンスでは、データベースエンジンによって発行される可能性がある大規模な IO ではなく、個々の 8 KB IO がカウントされます。

ページサーバーに対するデータ IO は、リソース使用率ビューまたは Azure Monitor メトリックでは報告されませんが、前述のように sys.dm_io_virtual_file_stats() で報告されます。

Hyperscale サービス階層 vCore の制限
Database Watcher を使用して Azure SQL ワークロードを監視する (プレビュー)
Azure SQL Database でパフォーマンスのためにアプリケーションとデータベースを調整する
クエリストアを使用したパフォーマンス監視
動的管理ビューを使用してパフォーマンスを監視する

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-11-03

次の方法で共有