ノイズ語
フルテキスト インデックスが肥大化するのを防ぐため、Microsoft SQL Server には頻繁に出現する、検索に役立たない語を破棄するメカニズムがあります。このような語をノイズ語 (ストップ ワード) といいます。ノイズ語は、ロケール固有のノイズ語ファイルに列挙されています。たとえば、英語ロケールでは、"a"、"and"、"is"、"the" などの語は検索に役立たないことが経験的に知られているため、英語のノイズ語ファイルに入れられ、フルテキスト インデックスから除外されます。ただし、フルテキスト インデックスではノイズ語の位置が考慮されます。たとえば、"Instructions are applicable to these Adventure Works Cycles models" という句があるとします。以下のテーブルは、句の中の語の位置を表しています。
語またはトークン | 位置 |
---|---|
Instructions |
1 |
are |
2 |
applicable |
3 |
to |
4 |
these |
5 |
Adventure |
6 |
Works |
7 |
Cycles |
8 |
models |
9 |
位置 2、4、および 5 にあるノイズ語 "are"、"to"、"these" は、フルテキスト インデックスから除外されます。ただし、その位置情報は保持されるため、語句内の他の語の位置は変わりません。
ノイズ語ファイルは、$SQL_Server_Install_Path\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\ ディレクトリに格納されます。このディレクトリの作成、およびノイズ語ファイルのインストールは、SQL Server のセットアップ時にフルテキスト検索のサポートを含めると実行されます。ノイズ語ファイルは編集できるので、たとえば、ハイテク企業のシステム管理者はノイズ語の一覧に「コンピュータ」という語を追加できます。
重要 : |
---|
ノイズ語ファイルを編集した場合、変更を有効にするには、フルテキスト カタログを再作成する必要があります。 |
次の表は、ノイズ語ファイルとそれぞれの言語を示します。
ノイズ語ファイル | 言語 |
---|---|
Noisechs |
簡体字中国語 |
Noisecht |
繁体字中国語 |
Noisedan |
デンマーク語 |
Noisedeu |
ドイツ語 |
Noiseeng |
英語 (UK) |
Noiseenu |
英語 (US) |
Noiseesn |
スペイン語 |
Noisefra |
フランス語 |
Noiseita |
イタリア語 |
Noisejpn |
日本語 |
Noisekor |
韓国語 |
Noiseneu |
ニュートラル言語 |
Noisenld |
オランダ語 |
Noiseplk |
ポーランド語 |
Noiseptb |
ポルトガル語 (ブラジル) |
Noisepts |
ポルトガル語 (ポルトガル) |
Noiserus |
ロシア語 |
Noisesve |
スウェーデン語 |
Noisetha |
タイ語 |
Noisetrk |
トルコ語 |