次の方法で共有


ストップ ワード ファイルを管理する (SharePoint Server 2010)

 

適用先: SharePoint Server 2010

トピックの最終更新日: 2015-03-09

"ストップ ワード" またはノイズ ワードとは、検索システムがエンド ユーザーの検索クエリで無視する言葉のことです。頻繁に出現し、検索結果の識別や絞り込みに役に立たないと思われる言葉は、ストップ ワードに指定される場合があります。たとえば、英語では "an"、"the" などの冠詞は通常はストップ ワードとして指定されます。英語のクエリ "the highest mountain" を入力すると、"the" はストップ ワードの場合はクエリから削除され、クエリは "highest mountain" となります。不快感を与える可能性のある言葉も、ストップ ワードとして指定されることがあります。

この記事の内容

  • ストップ ワード ファイルについて

  • ストップ ワード ファイルを編集する

  • 言語別のストップ ワード ファイル

ストップ ワード ファイルについて

ストップ ワードは、対象言語の "ストップ ワード ファイル" に記述されています。Microsoft SharePoint Server 2010 のインストール プログラムによって、対象製品でサポートされる言語ごとに 1 つずつストップ ワード ファイルが自動的にインストールされます。インストールされたストップ ワード ファイルの多くには、関連付けられている言語の一般的なストップ ワードが含まれています。たとえば、既定では、米国英語のストップ ワード ファイル (noiseenu.txt) には、"a"、"and"、"is"、"in"、"it"、"of"、"the"、"to" が含まれています。検索の管理者は、検索結果の関連性向上や組織標準への対応のために、製品のインストール後いつでも、ストップ ワード ファイル内のストップ ワードを追加または削除できます。ストップ ワード ファイル内のストップ ワードの追加または削除については、後の「ストップ ワード ファイルを編集する」を参照してください。サポートされる言語については、後の「言語別のストップ ワード ファイル」を参照してください。

クエリのとき、クエリの言語のワード ブレーカーは、言語の語彙規則に基づいて単語境界を決定することにより、検索クエリ内の個々の単語を識別します。その後、ワード ブレーカーはストップ ワード ファイルに列記されている言葉をクエリから削除します。

既定では、サポートされているすべての言語のストップ ワード ファイルが %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config にインストールされます。ファームの管理者が Search Service アプリケーションを作成すると、検索システムによって、ストップ ワード ファイルがインストール場所から (検索の管理者がその場所で編集したストップ ワード ファイルも含めて) %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config に自動的にコピーされます (GUID は、新しい Search Service アプリケーションの GUID です)。これは、その新しい Search Service アプリケーションが実行されるすべてのクエリ サーバーにコピーされます。したがって、その Search Service アプリケーションが実行されるクエリ サーバーごとにそれぞれストップ ワード ファイルのコピーが存在するようになります。

ストップ ワード ファイルを編集する

インストール場所にあるストップ ワード ファイルを編集すると、それ以降に作成された Search Service アプリケーションには、編集したストップ ワード ファイルが自動的にコピーされます。ただし、既存の Search Service アプリケーションには、編集したストップ ワード ファイルは自動的にはコピーされません。既存の Search Service アプリケーションにも変更を適用するには、その Search Service アプリケーションを実行する各クエリ サーバーの Search Service アプリケーション フォルダーに、編集したストップ ワード ファイルを手動でコピーする必要があります。

注意

  • ストップ ワード ファイルを削除すると、検索システムでは、単一文字がすべてストップ ワードと見なされ、検索結果から除外されます。ストップ ワード ファイル内には、少なくとも 1 つのエントリが必要です。エントリの内容は、ピリオド (.) 1 文字のみでもかまいません。

  • ストップ ワード ファイルを削除してから SharePoint Server Search 14 サービスを再起動すると、検索システムによって、削除したファイルがあったフォルダーに、%Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config にある同じ名前のファイルが自動的にコピーされ、ファイルが置き換えられます。

ストップ ワード ファイルを編集するには、次の手順に従います。

ストップ ワード ファイルを編集するには

  1. この手順を実行するユーザー アカウントが、ローカル サーバーの Administrators グループのメンバーであることを確認します。

  2. テキスト エディターでストップ ワード ファイルを開きます。適切なストップ ワード ファイルおよびその場所を特定する方法については、前の「ストップ ワード ファイルについて」を参照してください。

  3. 検索システムが検索クエリで無視する単語のみが含まれるように、ファイルを編集します。

  4. ストップ ワード ファイルを保存します。

    注意

    ストップ ワード ファイルを保存するときは、常に既定の [エンコード] 値 ([Unicode]) を使用します。

  5. 次の手順に従って、SharePoint Server Search 14 サービスを再起動します。

    1. [スタート] ボタンをクリックし、[管理ツール] をポイントします。次に、[サービス] をクリックします。

    2. [SharePoint Server Search 14] を右クリックし、[再起動] をクリックします。

      ストップ ワードの変更内容は、SharePoint Server Search 14 サービスの再起動後に有効になります。

      注意

      Microsoft Office SharePoint Server 2007 では、検索システムはクエリとインデックスからストップ ワードを除外しました。したがって、ストップ ワード ファイルから言葉を削除した後は、フル クロールを実行して、クローラーが検出する可能性のあるその言葉のインスタンスのインデックスを作成する必要がありました。一方、SharePoint Server 2010 では、ストップ ワードはクエリからは除外されますが、インデックスからは除外されないようになっています。したがって、SharePoint Server 2010 では、ストップ ワード ファイルから言葉を削除した場合でも、クロールの間に検出されている場合はストップ ワードについてもインデックスが既に作成されているので、新しいクロールを実行する必要はありません。ストップ ワード ファイルに言葉を追加する場合は、検索システムはインデックスでストップ ワードを検索しないので、新しいクロールを実行する必要はありません。

言語別のストップ ワード ファイル

SharePoint Server 2010 をインストールすると、以下の言語のストップ ワード ファイルがインストールされます。ストップ ワード ファイルが存在しない言語については、検索システムによってニュートラルなストップ ワード ファイル noiseneu.txt が使用されます。

言語 ストップ ワード ファイル名

アラビア語

noiseara.txt

ベンガル語

noiseben.txt

ブルガリア語

noisebul.txt

カタルニア語

noisecat.txt

チェコ語

noiseces.txt

簡体字中国語

noisechs.txt

繁体字中国語

noisecht.txt

クロアチア語

noisecro.txt

デンマーク語

noisedan.txt

オランダ語 (オランダ)

noisenld.txt

英語 (英国)

noiseeng.txt

英語 (米国)

noiseenu.txt

フィンランド語

noisefin.txt

フランス語

noisefra.txt

ドイツ語

noisedeu.txt

ギリシャ語

noisegrc.txt

グジャラート語

noiseguj.txt

ヘブライ語

noiseheb.txt

ヒンディー語

noisehin.txt

ハンガリー語

noisehun.txt

アイスランド語

noiseice.txt

インドネシア語

noiseind.txt

イタリア語

noiseita.txt

日本語

noisejpn.txt

カンナダ語

noisekan.txt

韓国語

noisekor.txt

ニュートラル言語

noiseneu.txt

ラトビア語

noiselav.txt

リトアニア語

noiselit.txt

マレー語

noisemal.txt

マラヤーラム語

noisemly.txt

マラーティー語

noisemar.txt

ノルウェー語 (ブークモール)

noisenor.txt

ポーランド語

noiseplk.txt

ポルトガル語 (ポルトガル)

noisepor.txt

ポルトガル語 (ブラジル)

noiseptb.txt

パンジャーブ語

noisepun.txt

ルーマニア語

noiserom.txt

ロシア語

noiserus.txt

セルビア語 (キリル)

noisesbc.txt

セルビア語 (ラテン)

noisesbl.txt

スロバキア語

noisesvk.txt

スロベニア語

noiseslo.txt

スペイン語

noiseesn.txt

スウェーデン語

noisesve.txt

タミール語

noisetam.txt

テルグ語

noisetel.txt

タイ語

noisetha.txt

トルコ語

noisetur.txt

ウクライナ語

noiseurk.txt

ウルドゥー語 (パキスタン)

noiseurd.txt

ベトナム語

noisevie.txt