フルテキストインデックスのパフォーマンスの向上

[アーティクル]
04/26/2017

フルテキストインデックス作成とフルテキストクエリのパフォーマンスは、メモリ、ディスク速度、CPU 速度、コンピューターのアーキテクチャなどのハードウェアリソースの影響を受けます。

パフォーマンスの問題の一般的な原因

フルテキストインデックス作成のパフォーマンス低下の主な原因となるのは、ハードウェアリソースの制限です。

フィルターデーモンホストプロセス (fdhost.exe) または SQL Server プロセス (sqlservr.exe) の CPU 使用率が 100% に近くなっている場合は、CPU がボトルネックになっています。
ディスク待ちのキューの長さが平均でディスクヘッド数の 2 倍を超えている場合は、ディスクがボトルネックになっています。この場合の主な回避策は、作成するフルテキストカタログを SQL Server のデータベースファイルやログから切り離し、ログ、データベースファイル、およびフルテキストカタログを別々のディスクに配置することです。その他、高速なディスクを購入したり RAID を使用することも、インデックス作成のパフォーマンス向上に役立ちます。
物理メモリが不足している場合 (3 GB 以下) は、メモリがボトルネックになっている可能性があります。物理メモリ上の制限は、すべてのシステムで発生する可能性があります。32 ビットシステムでは、仮想メモリの不足が原因でフルテキストインデックス作成に時間がかかることがあります。

Note

SQL Server 2008 以降では、Full-Text エンジンがsqlservr.exeの一部であるため、Full-Text エンジンは AWE メモリを使用できます。

システムにハードウェアのボトルネックがない場合、フルテキスト検索のインデックス作成パフォーマンスは、主に以下の条件に左右されます。

SQL Server によるフルテキストバッチの作成にかかる時間
フィルターデーモンがバッチを処理する速度

Note

増分、手動、および自動の変更追跡による作成は、完全作成とは違って、ハードウェアリソースを最大限に活用して処理を高速化するようには作られていません。このため、これらのチューニングのヒントでは、フルテキストインデックス作成のパフォーマンスを強化できない場合があります。

作成が完了すると、最終的なマージプロセスが起動され、インデックスフラグメントが 1 つのマスターフルテキストインデックスにマージされます。これにより、多数のインデックスフラグメントではなく、1 つのマスターインデックスのみをクエリすれば済むため、クエリのパフォーマンスが向上し、関連順位付けにもより的確なスコア (評価) 統計を適用できます。マスターのマージ処理では、インデックスフラグメントをマージする際に大量のデータを読み書きする必要があるため、大量の I/O が発生しますが、クエリの着信がブロックされることはありません。

重要

マスターマージで大量のデータを処理すると、実行時間が長いトランザクションが発生し、チェックポイント時のログの切り捨てが遅れる場合があります。この場合、完全復旧モデルでは、トランザクションログが非常に大きくなることがあります。完全復旧モデルを使用するデータベースで大きなフルテキストインデックスを再編成する前に、実行時間が長いトランザクションのための十分な領域をトランザクションログに割り当てることをお勧めします。詳細については、「トランザクションログファイルのサイズの管理」を参照してください。

フルテキストインデックスのパフォーマンスのチューニング

フルテキストインデックスのパフォーマンスを最大化するには、次に示すベストプラクティスを実装します。

すべてのプロセッサまたはコアを最大に使用するには、 sp_configure'max full-text crawl ranges' をシステム上の CPU の数に設定します。構成オプションの詳細については、「 max full-text crawl range サーバー構成オプション」を参照してください。
ベーステーブルにクラスター化インデックスがあることを確認します。クラスター化インデックスの最初の列には整数データ型を使用します。 GUID は使用しないようにしてください。クラスター化インデックスで複数の範囲の作成を使用すると、作成速度を最大限に高めることができます。フルテキストキーとして機能する列は整数データ型にすることをお勧めします。
UPDATE STATISTICS ステートメントを使用してベーステーブルの統計を更新します。さらに重要な点は、クラスター化インデックスの統計や完全作成のフルテキストキーを更新することです。これにより、複数の範囲の作成によってテーブルに適切なパーティションが生成されるようになります。
増分作成のパフォーマンスを強化するには、timestamp 列のセカンダリインデックスを作成します。
大型のマルチ CPU コンピューター上で完全作成を実行する前に、fdhost.exe プロセスおよびオペレーティングシステムが使用するメモリを十分に確保するために、max server memory 値を設定してバッファープールのサイズを一時的に制限することをお勧めします。詳細については、このトピックの「フィルターデーモンホストプロセス (fdhost.exe) のメモリ要件の推定」を参照してください。

完全作成のパフォーマンスに関するトラブルシューティング

パフォーマンスの問題を診断するには、フルテキストクロールログを調べます。クロールログの詳細については、「フルテキストインデックスの作成」を参照してください。

完全作成のパフォーマンスが不十分な場合は、次の順序でトラブルシューティングを行うことをお勧めします。

物理メモリの使用量

フルテキスト作成時は、fdhost.exe または sqlservr.exe がメモリ不足またはメモリ枯渇の状態で実行される可能性があります。フルテキストクロールのログを確認した結果、fdhost.exe が頻繁に再起動されているか、エラーコード 8007008 が返されていることが判明した場合は、これらのプロセスのいずれかでメモリ不足が生じています。特に大型のマルチ CPU コンピューター上で fdhost.exe がダンプを生成している場合、メモリが不足してきている可能性があります。

Note

フルテキストクロールで使用されるメモリバッファーに関する情報を取得するには、「 sys.dm_fts_memory_buffers (Transact-SQL)」を参照してください。

次のような原因が考えられます。

完全な作成中に使用可能な物理メモリの量がゼロの場合、SQL Server バッファープールがシステム上の物理メモリの大部分を消費している可能性があります。

sqlservr.exe プロセスは、構成されている最大サーバーメモリ量に達するまで、バッファープールで使用できるすべてのメモリを獲得しようとします。 max server memory の割り当てが大きすぎる場合は、fdhost.exe プロセスのメモリ不足や共有メモリの割り当ての失敗が発生することがあります。

Note

マルチ CPU コンピューター上でのフルテキスト作成時、fdhost.exe または sqlservr.exe との間でバッファープールメモリの競合が発生する場合があります。その結果、共有メモリが不足すると、バッチの再試行、メモリスラッシング、および fdhost.exe プロセスによるダンプが発生します。

この問題は、SQL Server バッファープールの値を適切に設定max server memoryすることで解決できます。詳細については、このトピックの「フィルターデーモンホストプロセス (fdhost.exe) のメモリ要件の推定」を参照してください。フルテキストインデックスの作成に使用されるバッチのサイズを小さくすると、有効な場合があります。
ページングの問題

拡張が制限された小さなページファイルが使用されているシステムにおいてページファイルのサイズが不足した場合、fdhost.exe または sqlservr.exe でメモリ不足が発生します。

クロールログにメモリ関連の障害が見当たらない場合、過剰なページングが原因でパフォーマンスが低下していることが考えられます。

フィルターデーモンホストプロセス (fdhost.exe) のメモリ要件の推定

fdhost.exe プロセスが作成のために必要とするメモリ量は、主に、プロセスが使用するフルテキストクロール範囲の数、受信共有メモリ (ISM) のサイズ、および ISM インスタンスの最大数に依存します。

フィルターデーモンホストによって使用されるメモリ量 (バイト単位) は、次の式を使用して概算できます。

number_of_crawl_ranges 'ism_size'max_outstanding_isms* 2

この式の変数の既定値は次のとおりです。

変数	既定値
number_of_crawl_ranges	CPU の数
ism_size	1 MB (x86 コンピューターの場合) 合計物理メモリにより、4 MB、8 MB、または 16 MB (x64 コンピューターの場合)
max_outstanding_isms	25 (x86 コンピューターの場合) 5 (x64 コンピューターの場合)

fdhost.exe のメモリ要件の推定方法に関するガイドラインを、以下の表に示します。この表の数式では次の値を使用します。

F: fdhost.exe に必要なメモリの推定値 (MB 単位)。
T: システムで使用できる合計物理メモリ (MB 単位)。
最適な max server memory 設定である M。

重要

数式に関する重要な情報については、以下の ¹、 ²、 ³ を参照してください。

プラットフォーム	fdhost.exe メモリ要件の MB-F^{1 での}推定	max server memory-M² を計算するための数式
x86	F=クロール範囲* の数50	M=minimum(T, 2000*)--`F`*** 500
X64	F=クロール範囲* の数10 * 8	M=T-F- 500

¹ 複数の完全な母集団が進行中の場合は、 F1、 F2 などとして、それぞれのfdhost.exeメモリ要件を個別に計算します。次に、M を T- sigma**(_F_i)** として計算します。

² 500 MB は、システム内の他のプロセスに必要なメモリの推定値です。システムで追加の作業を実行している場合、適宜この値を大きくします。

³ .ism_size は、x64 プラットフォームでは 8 MB と見なされます。

例 : fdhost.exe のメモリ要件の推定

この例は、8 GM の RAM と 4 つのデュアルコアプロセッサを搭載した AMD64 コンピューターを対象としています。最初の計算では、fdhost.exe に必要なメモリ (F) を推定します。クロール範囲の数は 8です。

F = 8*10*8=640

次の計算では、M の最適な値がmax server memory-取得されます。このシステムで使用可能な物理メモリの合計を MB-T-is8192 で指定します。

M = 8192-640-500=7052

例:max server memory の設定

この例では、sp_configure ステートメントと RECONFIGURETransact-SQL ステートメントを使用して、7052前の例の M に対して計算された値をに設定max server memoryします。

USE master;  
GO  
EXEC sp_configure 'max server memory', 7052;  
GO  
RECONFIGURE;  
GO

max server memory 構成オプションを設定するには

サーバーメモリに関するサーバー構成オプション

CPU 消費率の低下を招く要因

平均 CPU 消費率が約 30% 未満になると、完全作成のパフォーマンスが低下すると考えられます。ここでは、CPU 消費率に影響するいくつかの要因について説明します。

長いページ待機

ページの待機時間が長いかどうかを確認するには、次の Transact-SQL ステートメントを実行します。

Execute SELECT TOP 10 * FROM sys.dm_os_wait_stats ORDER BY wait_time_ms DESC;

次の表で、主な待機の種類について説明します。

待機の種類	説明	解決方法
PAGEIO_LATCH_SH (_EX または _UP)	IO がボトルネックとなっている可能性があります。この場合は通常、平均のディスクキューも長くなります。	別のディスクの別のファイルグループにフルテキストインデックスを移動すると、IO のボトルネックを軽減できる場合があります。
PAGELATCH_EX (または _UP)	複数のスレッドが同じデータベースファイルへの書き込みを試行し、多数の競合が発生している可能性があります。	フルテキストインデックスが格納されているファイルグループにファイルを追加すると、このような競合を軽減できる場合があります。

詳しくは「sys.dm_os_wait_stats (Transact-SQL)」をご覧ください。

非効率的なベーステーブルスキャン

完全作成では、バッチを生成するためにベーステーブルをスキャンします。次のようなシナリオでは、このテーブルスキャンの効率が下がる可能性があります。
- フルテキストインデックスが作成される行外の列がベーステーブルに高い比率で含まれている場合、バッチ生成のためのベーステーブルスキャンがボトルネックとなることがあります。その場合、varchar(max) または nvarchar(max) を使用して、比較的小さなデータを行内に移動すると解決することがあります。
- ベーステーブルが過度に断片化されていると、スキャンの効率が下がります。行外データの計算とインデックスの断片化については、「 sys.dm_db_partition_stats (Transact-SQL)」および「 sys.dm_db_index_physical_stats (Transact-SQL)」を参照してください。
  
  断片化を解消するには、クラスター化インデックスを再構成または再構築します。詳細については、「インデックスの再編成と再構築」を参照してください。

フィルター処理によるインデックス作成のパフォーマンス低下のトラブルシューティング

Full-Text Engine では、フルテキストインデックスを作成するときに、マルチスレッドフィルターとシングルスレッドフィルターの 2 種類のフィルターを使用します。フィルター処理するドキュメントに応じて、マルチスレッドフィルターを使用する場合 ( Microsoft Word 文書など) と、シングルスレッドフィルターを使用する場合 (Adobe Acrobat Portable Document Format (PDF) ドキュメントなど) があります。

セキュリティ上の理由から、フィルターはフィルターデーモンホストプロセスによって読み込まれます。サーバーインスタンスでは、マルチスレッドフィルターに対してはすべてマルチスレッド処理が使用され、シングルスレッドフィルターに対してはすべてシングルスレッド処理が使用されます。マルチスレッドフィルターを使用するドキュメントにシングルスレッドフィルターを使用するドキュメントが埋め込まれていると、Full-Text Engine では埋め込まれたドキュメントに対してシングルスレッド処理を開始します。たとえば、PDF ドキュメントが埋め込まれた Word 文書の場合、Full-Text Engine は、Word コンテンツに対してはマルチスレッドプロセスを使用し、PDF の内容に対してはシングルスレッドプロセスを開始します。ただし、このような環境では、シングルスレッドフィルターが適切に機能しない場合があり、フィルター処理が不安定になることがあります。このような埋め込みが通例であるような特定の状況では、不安定になった結果、フィルター処理がクラッシュすることもあります。クラッシュが発生すると、エラーが発生したドキュメント (たとえば、PDF の内容が埋め込まれた Word 文書) がシングルスレッドフィルター処理に再ルーティングされます。再ルーティングが頻繁に起こると、フルテキストインデックス作成処理のパフォーマンスが低下します。

この問題を回避するには、コンテナードキュメント (この場合は Word) に対するフィルターとして、シングルスレッドフィルターを設定します。フィルターのレジストリ値を変更して、特定のフィルターをシングルスレッドフィルターとして設定できます。フィルターをシングルスレッドフィルターとしてマークするには、フィルターの ThreadingModel レジストリ値をに設定する Apartment Threaded必要があります。シングルスレッドアパートメントの詳細については、ホワイトペーパー「 COM スレッドモデルの概要と使用方法」を参照してください。

参照

サーバーメモリに関するサーバー構成オプション
 max full-text crawl range サーバー構成オプション
 フルテキストインデックスの作成
 フルテキストインデックスの作成と管理
 sys.dm_fts_memory_buffers (Transact-SQL)
sys.dm_fts_memory_pools (Transact-SQL)
フルテキストインデックスの作成のトラブルシューティング

次の方法で共有

フルテキストインデックスのパフォーマンスの向上

パフォーマンスの問題の一般的な原因

フルテキストインデックスのパフォーマンスのチューニング

完全作成のパフォーマンスに関するトラブルシューティング

物理メモリの使用量

フィルターデーモンホストプロセス (fdhost.exe) のメモリ要件の推定

CPU 消費率の低下を招く要因

フィルター処理によるインデックス作成のパフォーマンス低下のトラブルシューティング

参照

その他のリソース

次の方法で共有

フルテキスト インデックスのパフォーマンスの向上

パフォーマンスの問題の一般的な原因

フルテキスト インデックスのパフォーマンスのチューニング

完全作成のパフォーマンスに関するトラブルシューティング

物理メモリの使用量

フィルター デーモン ホスト プロセス (fdhost.exe) のメモリ要件の推定

CPU 消費率の低下を招く要因

フィルター処理によるインデックス作成のパフォーマンス低下のトラブルシューティング

参照

その他のリソース

フルテキストインデックスのパフォーマンスの向上

フルテキストインデックスのパフォーマンスのチューニング

フィルターデーモンホストプロセス (fdhost.exe) のメモリ要件の推定