MSSQLSERVER_833

適用対象:SQL Server Azure SQL Managed Instance

詳細

属性	値
製品名	SQL Server
イベント ID	833
イベントソース	MSSQLSERVER
コンポーネント	SQLEngine
シンボル名	BUF_LONG_IO
メッセージテキスト	SQL Server は、データベース `[%ls] (%d)` のファイル [%ls] で、完了に %d 秒以上かかった I/O 要求を %d 個検出しました。 OS ファイルハンドルは 0x%p です。最新の実行時間の長い I/O のオフセットは %#016I64x です。

説明

このメッセージは、SQL Server がディスクからの読み取り要求やディスクへの書き込み要求を発行してからその要求が完了するまでの時間が 15 秒を超えたことを示しています。 SQL Server はこのエラーを報告し、I/O サブシステムに問題があることを示します。 SQL Server などのデータベース管理システム (DBMS) は、ファイル入出力 (I/O) 操作のタイムラインに依存します。次の項目のいずれかが原因で、I/O 操作がスタックまたはストールし、SQL Server の応答性とパフォーマンスに悪影響を及ぼす可能性があります。

ハードウェアの障害
ハードウェアが正しく構成されていません
ファームウェアの設定
フィルタードライバー
圧縮
バグ
I/O パスのその他の条件

これらの I/O の問題により、次の動作が発生する可能性があります。

ブロッキング。
ラッチの競合とタイムアウト。
低応答時間
リソース境界のストレッチ。
また、次のような、このメッセージに関連するその他の症状に気付く場合もあります。
- PAGEIOLATCH 待機の待機時間が長い。
- システムイベントログの警告またはエラー。
- システムモニターカウンターのディスク待機時間の問題を示します。

I/O 操作が 15 秒以上保留されている場合、SQL Server は次の手順を実行します。

操作が保留中であることを検出します。
詳細セクションで説明されているように、SQL Server エラーログに情報メッセージを書き込みます。

この情報メッセージのさまざまなセクションの説明を次の表に示します。

メッセージテキスト	説明
< 数値> occurrence(s)	読み取りまたは書き込み操作が 15 秒未満で完了しなかった I/O 要求の数。
ファイル情報	完全なファイル名、データベース名、およびデータベース ID (DBID) 番号。
ハンドル	ファイルのオペレーティングシステムハンドル。オペレーティングシステムハンドルをデバッガーやその他のユーティリティと共に使用して、I/O 要求パケット (IRP) 要求を追跡できます。
オフセット	最後に停止した I/O 操作または最後にストールした I/O 操作のオフセット。 IRP 要求の追跡に役立つデバッガーまたはその他のユーティリティでオフセットを使用できます。注: 情報メッセージが SQL Server エラーログに書き込まれると、I/O 操作がスタックしたりストールしたりしなくなったりする可能性があります。

考えられる原因

情報メッセージは、現在の負荷で次のいずれかの状態が発生している可能性があることを示します。

I/O サブシステム (SAN、NAS、直接接続) の構成ミス、またはハードウェア容量に達したために、ワークロードが I/O パス機能を超えています。
ワークロードが、I/O、CPU、HBA などの現在のシステム機能を超えています。
I/O パスに誤動作するソフトウェアがあります。ファームウェアまたはドライバーの問題が考えられます。
I/O パスには、ハードウェアコンポーネントの誤動作があります。
オペレーティングシステムレベルでのパフォーマンスの問題。
データベースファイルの I/O プロセスまたはストレージパスでのフィルタードライバーの介入。たとえば、ウイルス対策プログラムなどです。

SQL Server は、I/O 要求を開始した時刻を記録し、I/O が完了した時刻を記録します。その差が 15 秒以上の場合、この状態が検出されます。また、このメッセージで説明および報告される遅延 I/O 条件の原因が SQL Server ではないことも意味します。この状態は、ストールした I/O と呼ばれます。ほとんどのディスク要求は、ディスクの標準的な速度で行われます。この一般的なディスク速度は、ディスクシーク時間とよく呼ばれます。ほとんどの標準的なディスクのディスクシーク時間は 10 ミリ秒以下になります。そのため、システム I/O パスが SQL Server に戻る時間は 15 秒です。詳細については、「詳細情報」セクションを参照してください。

ユーザーアクション

次の手順を実行して、このエラーのトラブルシューティングを行います。

システムイベントログで、ハードウェア関連のエラーメッセージを確認します。
ハードウェア固有のログが使用可能かどうかを調べます。オペレーティングシステム、ドライバー、または I/O ハードウェアの遅延の原因を特定するために必要な方法と手法を使用します。
すべてのデバイスドライバーとファームウェアを更新するか、I/O サブシステムに関連付けられている他の診断を実行します。
ディスクアクセスは、フィルタードライバー (ウイルス対策プログラムなど) によって遅くなる可能性があります。アクセス速度を上げるには、エラーメッセージで指定されている SQL Server データファイルをアクティブなウイルススキャンから除外します。詳細については、「 SQL Server (microsoft.com)を実行しているコンピューターで実行するウイルス対策ソフトウェアを選択する方法」を参照してください。
- fltmc.exeコマンドラインユーティリティを使用してシステムにインストールされているすべてのフィルタードライバーに対してクエリを実行し、データベースファイルへのストレージパスで実行される関数を理解します。
パフォーマンスモニターを使用して、次のカウンターを調べます。
- 平均ディスク転送時間
- 平均ディスクキューの長さ
- 現在のディスクキューの長さ
Storport ETW ログなどの機能を使用してディスクユニットに対して行われた要求の待機時間を測定することもできます。 Windows Performance Recorder の組み込みプロファイルとして、他の同様のディスク I/O トラブルシューティングキットを使用できます。
sys.dm_io_virtual_file_statsを監視し、ストレージスループットに適したストレージ層と IOPS を選択します。

I/O の問題が原因で発生する SQL Server のパフォーマンスの問題を診断およびトラブルシューティングするためのガイド付きチュートリアルについては、「 I/O の問題が原因で SQL Server のパフォーマンスが低下する問題をトラブルシューティングするを参照してください。

詳細

スタック I/O とストールした I/O

スタック I/O

スタック I/O は、完了しない I/O 要求として定義されます。頻繁に、スタック I/O はスタック IRP を示します。スタックした I/O 状態を解決するには、通常、コンピューターを再起動するか、同様の操作を実行する必要があります。スタック I/O 状態は、通常、次のいずれかの問題を示します。

ハードウェアの障害。
I/O パスコンポーネントのバグ。

ストールした I/O

ストールした I/O は、完了する I/O 要求として定義されているか、完了までに過剰な時間がかかります。通常、ストールした I/O 動作は、次のいずれかの理由で発生します。

ハードウェア構成。
ファームウェアの設定。
トレースして解決するためにハードウェアまたはソフトウェアベンダーからの支援を必要とするフィルタードライバーの問題。

SQL Server で I/O がストールし、I/O の記録とレポートが停止する

SQL Server サポートは、スタックまたはストールしている I/O の問題を含む多くのケースを毎年処理します。これらの I/O の問題は、さまざまな方法で表示されます。 I/O の問題は、診断とデバッグが最も困難な問題の一部であり、Microsoft とお客様からのデバッグにかなりの時間とリソースが必要です。 I/O 要求のレポートと記録は、ファイルごとに設計されています。ストールした I/O 要求とスタック I/O 要求の検出と報告は、2 つの異なるアクションです。

記録

SQL Server でレコードアクションが発生する瞬間は 2 つあります。 1 つ目は、I/O 操作が完了したときです。 2 番目の瞬間は、レイジーライターが実行されたときです。遅延ライターを実行すると、保留中のすべてのデータと保留中のログファイル I/O 要求がチェックされます。 I/O 要求が 15 秒のしきい値を超えると、レコード操作が発生します。

レポート

レポートは、5 分以上離れた間隔で行われます。レポートは、ファイルで次の I/O 要求が行われるときに発生します。レコードアクションが発生し、最後のレポートが発生してから 5 分以上経過した場合は、「詳細」セクションに記載されている情報メッセージが SQL Server エラーログに書き込まれます。

15 秒のしきい値は調整できません。ただし、トレースフラグ 830 を使用して、ストールしている I/O 検出またはスタック I/O 検出を無効にすることはできますが、これを行うことはお勧めしません。

トレースフラグ 830 を使用して、ストールおよびスタック I/O の検出を無効にすることができます。 SQL Server が起動されるたびにこのフラグを有効にするには、-T830 スタートアップパラメーターを使用します。現在実行中の SQL Server インスタンスの検出を無効にするには、次のステートメントを使用します。

    dbcc traceon(830, -1)

この設定は、SQL Server プロセスの有効期間にのみ有効です。

注

ストールまたはスタック状態になった I/O 要求は、1 回だけ報告されます。たとえば、10 個の I/O 要求がストールしていることをメッセージが報告した場合、それらの 10 個のレポートは再び発生しません。次のメッセージで、15 個の I/O 要求がストールしていることを報告した場合は、15 個の新しい I/O 要求がストールしていることを意味します。

I/O 要求パケット (IRP) の追跡

SQL Server では、標準の Microsoft Windows API 呼び出しを使用してデータの読み取りと書き込みを行います。たとえば、SQL Server では次の関数が使用されます。

WriteFile
ファイルを読む
WriteFileScatter
ReadFileGather

読み取りまたは書き込み要求は、I/O 要求パケット (IRP) として Windows によって処理されます。 IRP の状態を確認するには、次の機能の両方を使用します。

Windows のサポート
Storport ETW のログ記録

次の項目で利用可能な更新プログラムがあるかどうかを確認することをお勧めします。

The BIOS
ファームウェア
その他の I/O パスコンポーネント

追加のデバッグ操作を実行する前に、ハードウェアベンダーに問い合わせてください。デバッグセッションには、サードパーティ製のドライバー、ファームウェア、またはフィルタードライバーコンポーネントが含まれる可能性があります。

システムパフォーマンスとクエリプランのアクション

全体的に、システムパフォーマンスは I/O 処理で重要な役割を果たすことができます。ストールまたはスタックした I/O 操作のレポートを調査する際は、システムの全般的な正常性を考慮する必要があります。負荷が過剰になると、I/O 処理を含め、システム全体が遅くなる可能性があります。問題が発生したときのシステムの動作は、問題の根本原因を特定する上で重要な要素となる可能性があります。たとえば、問題が発生している間に CPU 使用率が増加したり、高いままになったりした場合、システムプロセスが CPU を非常に多く使用しているため、他のプロセスが悪影響を受けている可能性があります。

パフォーマンスカウンター

I/O パフォーマンスを監視するには、次のパフォーマンスカウンターで特定の I/O パス情報を調べます。

平均ディスク転送時間
平均ディスクキューの長さ
現在のディスクキューの長さ

たとえば、SQL Server を実行しているコンピューターの平均ディスク秒/転送時間は、通常 15 ミリ秒未満です。平均ディスク秒/転送値が上昇した場合、I/O サブシステムが I/O 需要に最適に対応していないことを示します。

SQL Server は、ディスクキューの長さを大きくプッシュする非同期 I/O 機能を最大限に活用するため、パフォーマンスカウンターを使用する際は注意してください。そのため、ディスクキューの長さが長いだけでは問題は示されません。

Windows システムモニターでは、影響を受ける各ディスクのカウンター "物理ディスク: ディスクバイト/秒" を確認し、各プロセスのカウンター "Process: IO Data Bytes/Sec" と "Process: IO Other Bytes/sec" とアクティビティのレートを比較できます。これを行って、特定のプロセスセットが過剰な I/O 要求を生成しているかどうかを識別します。 Process オブジェクト内の他のさまざまな I/O 関連カウンターにより、より詳細な情報が表示されます。 SQL Server インスタンスがサーバー上の過剰な I/O 負荷の原因であると判断した場合は、インデックスと並列処理に関する次のセクションを参照してください。 I/O のボトルネックの検出と解決の詳細については、「 I/O の問題が原因で SQL Server のパフォーマンスが低下するをトラブルシューティングする」を参照してください。

インデックスと並列処理

多くの場合、インデックスがないために I/O のバーストが発生します。この動作により、I/O パスが重大にプッシュされる可能性があります。インデックスの回転ウィザード (ITW) を使用するパスは、システムの I/O 負荷を解決するのに役立ちます。クエリがテーブルスキャンではなくインデックスの恩恵を受けたり、並べ替えやハッシュを使用したりする場合、システムは次の利点を得ることができます。

クエリのパフォーマンス上の利点を直接生み出すアクションを完了するために必要な物理 I/O が削減されます。
データキャッシュ内のページの数を減らしておく必要があります。そのため、データキャッシュ内にあるページはアクティブなクエリに関連し続けます。
インデックスが見つからないか、統計が古いために、並べ替えとハッシュが使用されます。 1 つ以上のインデックスを追加することで、tempdb の使用と競合を減らすことができます。
リソース、並列操作、またはその両方で削減が行われます。 SQL Server ではクエリの並列実行が保証されず、システムの負荷が考慮されるため、すべてのクエリをシリアル実行用に最適化することをお勧めします。クエリを最適化するには、Query Analyzer を開き、並列処理の最大次数オプションのsp_configure値を 1 に設定します。すべてのクエリがシリアル操作として迅速に実行されるようにチューニングされている場合、並列実行の方が良い結果になることが多いです。ただし、多くの場合、並列実行は、データ量が多いために選択されます。インデックスがない場合は、大きな並べ替えが必要になる場合があります。並べ替え操作を実行している複数のワーカーは、より迅速な応答を作成します。ただし、このアクションにより、システムへの負荷が大幅に増加する可能性があります。多くのワーカーからの読み取り要求が大きいと、CPU 使用率の増加とともに I/O バーストが発生する可能性があります。多くの場合、インデックスが追加された場合や、別のチューニングアクションが発生した場合に、クエリをチューニングして実行速度を向上させ、使用するリソースを減らすことができます。

SQL Server サポートの実際の例

次の例は、SQL Server サポートと Windows エスカレーションサポートによって処理されています。これらの例は、参照フレームを提供し、ストールしている I/O 状況やスタック I/O 状況に関する期待値を設定することを目的としています。また、システムが影響を受けるか、応答する可能性があることを理解するためのフレームワークも提供します。特定のハードウェアやドライバーのセットは、特定のリスクや他のドライバーに対するリスクの増加を引き起こす可能性はありません。この点では、すべてのシステムが同じです。

例 1: 45 秒間スタックしているログ書き込み

SQL Server ログファイルを定期的に書き込もうとすると、約 45 秒間停止します。ログの書き込みがタイムリーに完了しません。この動作により、30 秒のクライアントタイムアウトが発生するブロック条件が作成されます。

アプリケーションが SQL Server にコミットを送信すると、コミットはログ書き込み保留中としてスタックします。この動作により、クエリはロックを保持し続け、他のクライアントからの受信要求をブロックします。その後、他のクライアントがタイムアウトし始めます。これにより、クエリのタイムアウトが発生したときにアプリケーションが開いているトランザクションをロールバックしないため、この問題が生じます。これにより、ロックを保持している何百もの開いているトランザクションが作成されます。したがって、重大なブロッキング状況が発生します。

トランザクションの処理とブロックの詳細については、次のマイクロソフトサポート技術情報の記事を参照してください。 224453 SQL Server のブロックの問題の理解と解決

アプリケーションは、接続プールを使用して Web サイトを処理します。ブロックされる接続が増えるにつれて、Web サイトはより多くの接続を作成します。これらの接続はブロックされ、サイクルは続行されます。

ログの書き込みが完了するまでに約 45 秒かかります。ただし、この時点では、数百の接続がバックアップされます。ブロックの問題により、SQL Server とアプリケーションの復旧時間が数分になります。アプリケーションの問題と組み合わせると、ストールした I/O 状態はシステムに非常に悪影響を及ぼします。

解像度

この問題は、ホストバスアダプター (HBA) ドライバーでスタックしている I/O 要求に追跡されます。コンピューターには、フェールオーバーをサポートする複数の HBA カードがあります。 1 つの HBA が遅れているか、記憶域ネットワーク (SAN) と通信していない場合、"フェールオーバー前の再試行" タイムアウト値は 45 秒に構成されます。タイムアウトを超えると、I/O 要求は 2 番目の HBA にルーティングされます。 2 番目の HBA は要求を処理し、すぐに完了します。このようなストール状態を防ぐために、ハードウェアの製造元は 5 秒の "フェールオーバー前の再試行" 設定を推奨しています。

例 2: フィルタードライバーの介入

多くのウイルス対策ソフトウェアプログラムとバックアップ製品では、I/O フィルタードライバーが使用されています。これらの I/O フィルタードライバーは、I/O 要求スタックの一部になり、IRP 要求にアクセスできます。 Microsoft 製品サポートサービスでは、フィルタードライバーの実装で I/O 状態がスタックしたり、I/O 条件がストールしたりするバグから、さまざまな問題が発生しています。

このような条件の 1 つは、バックアップが発生したときに開かれているファイルのバックアップを許可するバックアップ処理のフィルタードライバーです。システム管理者は、ファイルバックアップの選択に SQL Server データファイルディレクトリを含めます。バックアップが行われると、バックアップはバックアップの開始時にファイルの正しいイメージの収集を試みます。これにより、I/O 要求が遅延します。 I/O 要求は、ソフトウェアで処理されるため、一度に 1 つだけ完了できます。

バックアップが開始されると、SQL Server の I/O が一度に 1 つずつ完了するように強制されるため、SQL Server のパフォーマンスが大幅に低下します。一度に 1 つのロジックは、I/O 操作を非同期的に実行できないので、問題が発生します。そのため、SQL Server が I/O 要求を投稿して続行すると予想される場合、ワーカーは I/O 要求が完了するまで読み取りまたは書き込み呼び出しでスタックします。フィルタードライバーのアクションは、SQL Server の先読みなどの処理タスクを効果的に無効にします。さらに、フィルタードライバーの別のバグは、バックアップが完了した場合でも、プロセス内の一度に 1 つのアクションを残します。 SQL Server のパフォーマンスを復元する唯一の方法は、フィルタードライバーの操作なしでファイルハンドルが解放され、再取得されるように SQL Server を再起動することです。

解像度

この問題を解決するために、SQL Server データファイルはファイルバックアッププロセスから削除されます。ソフトウェアの製造元は、ファイルを "一度に 1 つずつ" モードのままにした問題を修正しました。

例 3: 非表示のエラー

多くのハイエンドシステムには、負荷分散や同様のアクティビティを処理するためのマルチチャネル I/O パスがあります。 Microsoft 製品サポートは、I/O 要求が失敗するが、ソフトウェアがエラー状態を正しく処理しない負荷分散ソフトウェアに関する問題を検出しました。ソフトウェアは無限の再試行を試みることができます。 I/O 操作が停止し、SQL Server が指定したアクションを完了できません。前に説明したログ書き込み条件と同様に、このような状態がシステムにくさびを付けた後に、システムの動作が低下する可能性があります。

解像度

この問題を解決するには、SQL Server を再起動します。ただし、場合によっては、オペレーティングシステムを再起動して処理を復元する必要があります。また、I/O ベンダーからソフトウェア更新プログラムを入手することもお勧めします。

例 4: リモート・ストレージ、ミラーリング、および RAID ドライブ

多くのシステムでは、ミラーリングを使用するか、同様の手順を採用してデータ損失を防ぎます。ミラーリングを使用するシステムの中にはソフトウェアベースのシステムもあれば、ハードウェアベースのシステムもあります。これらのシステムのMicrosoft サポートによって通常検出される状況は、待機時間の増加です。

I/O 全体の時間の増加は、I/O が完了したと見なされる前に完了する必要があるときに発生します。リモート・ミラー・インストールの場合、ネットワーク再試行が関与する可能性があります。ドライブの障害が発生し、RAID システムが再構築されている場合、I/O パターンも中断される可能性があります。

解像度

ミラーまたは RAID 再構築操作の待機時間を短縮するには、厳密な構成設定が必要です。

例 5: 圧縮

Microsoft では、圧縮ドライブ上の SQL Server データファイルとログファイルはサポートされていません。 NTFS 圧縮は書き込み先ログ (WAL) プロトコルを中断するため、SQL Server では NTFS 圧縮は安全ではありません。 NTFS 圧縮では、I/O 操作ごとに処理を増やす必要もあります。圧縮では、重大なパフォーマンスの問題が発生する動作と同様に、"一度に 1 つずつ" が作成されます。

解像度

この問題を解決するには、データとログファイルを圧縮解除します。

詳細については、「圧縮ボリューム上のデータベースのサポートを参照してください。

追加のデータポイント

PAGEIOLATCH_* と書き込みログの待機sys.dm_os_wait_stats動的管理ビュー (DMV) は、I/O パスのパフォーマンスを調査するための重要なインジケーターです。 PAGEIOLATCH 待機が大量に発生する場合は、SQL Server が I/O サブシステムで待機していることを意味します。一定の PAGEIOLATCH 待機が一般的であり、予期される動作です。ただし、PAGEIOLATCH の平均待機時間が一貫して 10 ミリ秒を超える場合は、I/O サブシステムに負荷がかかっている理由を調査する必要があります。詳細については、以下のドキュメントをご覧ください。

参考文献

SQL Server では、 SQL Server I/O 信頼性プログラムの要件に関する説明に従って、システムで "安定したメディアへの確実な配信" がサポートされている必要があります。 SQL Server データベースエンジンの入力要件と出力要件の詳細については、「入力/出力の要件データベースエンジンを参照してください。

I/O エラーの詳細については、「Microsoft SQL Server I/O Basics, Chapter 2」 (Microsoft SQL Server I/O の基礎 (第 2 章)) を参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-01-02

MSSQLSERVER_833

詳細

説明

考えられる原因

ユーザー アクション

詳細

スタック I/O とストールした I/O

SQL Server で I/O がストールし、I/O の記録とレポートが停止する

I/O 要求パケット (IRP) の追跡

システム パフォーマンスとクエリ プランのアクション

SQL Server サポートの実際の例

追加のデータ ポイント

フィードバック

その他のリソース

ユーザーアクション

システムパフォーマンスとクエリプランのアクション

追加のデータポイント