ストップ ワード ファイルを管理する (SharePoint Server 2010)
適用先: SharePoint Server 2010
トピックの最終更新日: 2015-03-09
"ストップ ワード" またはノイズ ワードとは、検索システムがエンド ユーザーの検索クエリで無視する言葉のことです。頻繁に出現し、検索結果の識別や絞り込みに役に立たないと思われる言葉は、ストップ ワードに指定される場合があります。たとえば、英語では "an"、"the" などの冠詞は通常はストップ ワードとして指定されます。英語のクエリ "the highest mountain" を入力すると、"the" はストップ ワードの場合はクエリから削除され、クエリは "highest mountain" となります。不快感を与える可能性のある言葉も、ストップ ワードとして指定されることがあります。
この記事の内容
ストップ ワード ファイルについて
ストップ ワード ファイルを編集する
言語別のストップ ワード ファイル
ストップ ワード ファイルについて
ストップ ワードは、対象言語の "ストップ ワード ファイル" に記述されています。Microsoft SharePoint Server 2010 のインストール プログラムによって、対象製品でサポートされる言語ごとに 1 つずつストップ ワード ファイルが自動的にインストールされます。インストールされたストップ ワード ファイルの多くには、関連付けられている言語の一般的なストップ ワードが含まれています。たとえば、既定では、米国英語のストップ ワード ファイル (noiseenu.txt) には、"a"、"and"、"is"、"in"、"it"、"of"、"the"、"to" が含まれています。検索の管理者は、検索結果の関連性向上や組織標準への対応のために、製品のインストール後いつでも、ストップ ワード ファイル内のストップ ワードを追加または削除できます。ストップ ワード ファイル内のストップ ワードの追加または削除については、後の「ストップ ワード ファイルを編集する」を参照してください。サポートされる言語については、後の「言語別のストップ ワード ファイル」を参照してください。
クエリのとき、クエリの言語のワード ブレーカーは、言語の語彙規則に基づいて単語境界を決定することにより、検索クエリ内の個々の単語を識別します。その後、ワード ブレーカーはストップ ワード ファイルに列記されている言葉をクエリから削除します。
既定では、サポートされているすべての言語のストップ ワード ファイルが %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config にインストールされます。ファームの管理者が Search Service アプリケーションを作成すると、検索システムによって、ストップ ワード ファイルがインストール場所から (検索の管理者がその場所で編集したストップ ワード ファイルも含めて) %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config に自動的にコピーされます (GUID は、新しい Search Service アプリケーションの GUID です)。これは、その新しい Search Service アプリケーションが実行されるすべてのクエリ サーバーにコピーされます。したがって、その Search Service アプリケーションが実行されるクエリ サーバーごとにそれぞれストップ ワード ファイルのコピーが存在するようになります。
ストップ ワード ファイルを編集する
インストール場所にあるストップ ワード ファイルを編集すると、それ以降に作成された Search Service アプリケーションには、編集したストップ ワード ファイルが自動的にコピーされます。ただし、既存の Search Service アプリケーションには、編集したストップ ワード ファイルは自動的にはコピーされません。既存の Search Service アプリケーションにも変更を適用するには、その Search Service アプリケーションを実行する各クエリ サーバーの Search Service アプリケーション フォルダーに、編集したストップ ワード ファイルを手動でコピーする必要があります。
注意
-
ストップ ワード ファイルを削除すると、検索システムでは、単一文字がすべてストップ ワードと見なされ、検索結果から除外されます。ストップ ワード ファイル内には、少なくとも 1 つのエントリが必要です。エントリの内容は、ピリオド (.) 1 文字のみでもかまいません。
-
ストップ ワード ファイルを削除してから SharePoint Server Search 14 サービスを再起動すると、検索システムによって、削除したファイルがあったフォルダーに、%Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config にある同じ名前のファイルが自動的にコピーされ、ファイルが置き換えられます。
ストップ ワード ファイルを編集するには、次の手順に従います。
ストップ ワード ファイルを編集するには
この手順を実行するユーザー アカウントが、ローカル サーバーの Administrators グループのメンバーであることを確認します。
テキスト エディターでストップ ワード ファイルを開きます。適切なストップ ワード ファイルおよびその場所を特定する方法については、前の「ストップ ワード ファイルについて」を参照してください。
検索システムが検索クエリで無視する単語のみが含まれるように、ファイルを編集します。
ストップ ワード ファイルを保存します。
注意
ストップ ワード ファイルを保存するときは、常に既定の [エンコード] 値 ([Unicode]) を使用します。
次の手順に従って、SharePoint Server Search 14 サービスを再起動します。
[スタート] ボタンをクリックし、[管理ツール] をポイントします。次に、[サービス] をクリックします。
[SharePoint Server Search 14] を右クリックし、[再起動] をクリックします。
ストップ ワードの変更内容は、SharePoint Server Search 14 サービスの再起動後に有効になります。
注意
Microsoft Office SharePoint Server 2007 では、検索システムはクエリとインデックスからストップ ワードを除外しました。したがって、ストップ ワード ファイルから言葉を削除した後は、フル クロールを実行して、クローラーが検出する可能性のあるその言葉のインスタンスのインデックスを作成する必要がありました。一方、SharePoint Server 2010 では、ストップ ワードはクエリからは除外されますが、インデックスからは除外されないようになっています。したがって、SharePoint Server 2010 では、ストップ ワード ファイルから言葉を削除した場合でも、クロールの間に検出されている場合はストップ ワードについてもインデックスが既に作成されているので、新しいクロールを実行する必要はありません。ストップ ワード ファイルに言葉を追加する場合は、検索システムはインデックスでストップ ワードを検索しないので、新しいクロールを実行する必要はありません。
言語別のストップ ワード ファイル
SharePoint Server 2010 をインストールすると、以下の言語のストップ ワード ファイルがインストールされます。ストップ ワード ファイルが存在しない言語については、検索システムによってニュートラルなストップ ワード ファイル noiseneu.txt が使用されます。
言語 | ストップ ワード ファイル名 |
---|---|
アラビア語 |
noiseara.txt |
ベンガル語 |
noiseben.txt |
ブルガリア語 |
noisebul.txt |
カタルニア語 |
noisecat.txt |
チェコ語 |
noiseces.txt |
簡体字中国語 |
noisechs.txt |
繁体字中国語 |
noisecht.txt |
クロアチア語 |
noisecro.txt |
デンマーク語 |
noisedan.txt |
オランダ語 (オランダ) |
noisenld.txt |
英語 (英国) |
noiseeng.txt |
英語 (米国) |
noiseenu.txt |
フィンランド語 |
noisefin.txt |
フランス語 |
noisefra.txt |
ドイツ語 |
noisedeu.txt |
ギリシャ語 |
noisegrc.txt |
グジャラート語 |
noiseguj.txt |
ヘブライ語 |
noiseheb.txt |
ヒンディー語 |
noisehin.txt |
ハンガリー語 |
noisehun.txt |
アイスランド語 |
noiseice.txt |
インドネシア語 |
noiseind.txt |
イタリア語 |
noiseita.txt |
日本語 |
noisejpn.txt |
カンナダ語 |
noisekan.txt |
韓国語 |
noisekor.txt |
ニュートラル言語 |
noiseneu.txt |
ラトビア語 |
noiselav.txt |
リトアニア語 |
noiselit.txt |
マレー語 |
noisemal.txt |
マラヤーラム語 |
noisemly.txt |
マラーティー語 |
noisemar.txt |
ノルウェー語 (ブークモール) |
noisenor.txt |
ポーランド語 |
noiseplk.txt |
ポルトガル語 (ポルトガル) |
noisepor.txt |
ポルトガル語 (ブラジル) |
noiseptb.txt |
パンジャーブ語 |
noisepun.txt |
ルーマニア語 |
noiserom.txt |
ロシア語 |
noiserus.txt |
セルビア語 (キリル) |
noisesbc.txt |
セルビア語 (ラテン) |
noisesbl.txt |
スロバキア語 |
noisesvk.txt |
スロベニア語 |
noiseslo.txt |
スペイン語 |
noiseesn.txt |
スウェーデン語 |
noisesve.txt |
タミール語 |
noisetam.txt |
テルグ語 |
noisetel.txt |
タイ語 |
noisetha.txt |
トルコ語 |
noisetur.txt |
ウクライナ語 |
noiseurk.txt |
ウルドゥー語 (パキスタン) |
noiseurd.txt |
ベトナム語 |
noisevie.txt |