SharePoint Server の検索スキーマの概要
適用対象:2016 2019 Subscription Edition SharePoint in Microsoft 365
検索インデックスは検索の中心です。 検索クエリを入力するか、インターネット ページまたはイントラネット ページを操作すると、この検索インデックスの内容によって、情報を検索するユーザーとその検索のタイミングが特定されます。
この記事では、検索スキーマを使用して、検索インデックスのコンテンツを収集および取得する方法について説明します。 検索スキーマには、クロールされたプロパティ、クロールされたプロパティのカテゴリ、管理プロパティ マッピングへクロールされたプロパティ、および管理プロパティの設定が含まれます。 管理プロパティの設定では、プロパティで絞り込みまたはクエリの実行が可能な場合などに検索対象と検索の方法が定義されます。
クロールとクロールされたプロパティ
検索インデックスを構築するには、まず、コンテンツをクロールする必要があります。 SharePoint Server コンテンツ、ファイル共有、ユーザー プロファイルなど、さまざまなコンテンツ ソースをクロールできます。 クロールするアイテムのコンテンツとメタデータは、クロールされたプロパティとして表されます。
クロールが完了し、コンテンツ処理コンポーネントに渡された各アイテムに、クロールされたプロパティが関連付けられています。 たとえば、 Author 、 Title 、 Creation Date などのプロパティがあります。 新しくクロールされたプロパティはすべて自動的に検出されます。
クロールされたプロパティは、アイテムの IFilter またはプロトコル ハンドラーに基づいてカテゴリ別にグループ化されます。 たとえば、 Office (Word 文書、Excel ワークシートなどのクロールされたプロパティ)、 Business Data (サンプル データベースのクロールされたプロパティ)、 Web (Web サイトのクロールされたプロパティ) などのカテゴリがあります。
クロールの詳細については、「SharePoint Server のクロールとフェデレーションを計画する」を参照してください。
管理プロパティとプロパティのマッピング
クロールされたプロパティのコンテンツとメタデータを検索インデックスに含めるには、クロールされたプロパティを管理プロパティにマップする必要があります。 管理プロパティのみが検索インデックスに書き込まれます。
管理プロパティには多数の設定があります。 この管理プロパティの設定により、コンテンツが検索結果にどのように表示され、どのように検索できるかが特定されます。
複数のクロールされたプロパティを 1 つの管理プロパティにマップできます。 たとえば、クロールされたプロパティである "Writer" と "Author" の両方を、"Author" 管理プロパティにマップすることができます。 また、1 つのクロールされたプロパティを複数の管理プロパティにマップすることもできます。
また、管理プロパティのコンテンツは、クロールされたプロパティが管理プロパティにマップされている順序で指定できます。 たとえば、管理プロパティでは複数のクロールされたプロパティを管理プロパティにマップでき、管理プロパティにマップされたすべてのクロールされたプロパティの値をすべて含むように設定できます。 ただし、マッピング時に SharePoint タイトル プロパティを含むクロールされたプロパティに別のタイトルを付けても、検索結果には SharePoint のタイトルが表示されます。
クロールされたプロパティと管理プロパティの間に既定のマッピング セットが定義されました。「クロールされたプロパティと管理プロパティの概要 (SharePoint Server)」を参照してください。
クロールされたプロパティの中には、新しい管理プロパティと、クロールされたプロパティと管理プロパティ間のマッピングを自動的に生成するものがあります。 たとえば、SharePoint ライブラリでは、すべてのサイト列にこの自動生成およびマッピング機能が含まれます。 リストにサイト列を作成し、そのリストをクロールすると、クロールされたプロパティ、管理プロパティ、およびクロールされたプロパティと管理プロパティ間のマッピングが、そのサイト列に対して自動的に作成されます。
クロールされたプロパティから管理プロパティへの既定のマッピングまたはその他のマッピングを変更し、マッピングまたは管理プロパティを新しく作成することができます。 新しい管理プロパティを作成する場合、または既存の管理プロパティで特定の設定を変更する場合は、管理プロパティとその値を検索インデックスに含める前にフル クロールを実行する必要があります。 新しいか変更されたプロパティが SharePoint ライブラリまたはリストに含まれる場合、 SharePoint コンテンツ ソース全体のフル クロールを開始することなく、この個々のライブラリまたはリストを再インデックス化できます。 この機能はフル クロールの機能と同じです。
詳細については、この記事で後述する「管理プロパティの設定の概要」の表をご覧ください。
検索スキーマ
検索スキーマは、検索管理データベースに格納されています。 検索スキーマの内容は次のとおりです。
クロールされたプロパティと管理プロパティの間のマッピング。 このマッピングは、1 つのクロールされたプロパティから 1 つの管理プロパティ、1 つのクロールされたプロパティから多数の管理プロパティ、多数のクロールされたプロパティから 1 つの管理プロパティ、また多数のクロールされたプロパティから多数の管理マッピングにも可能です。
管理プロパティを検索インデックスにどのように書き込むか。 管理プロパティの値が書き込まれるフルテキスト インデックス、ウェイト グループ (コンテキスト) など。
各種管理プロパティの設定。 たとえば、検索結果の検索、クエリ、または絞り込みを、特定の管理プロパティに従って実行できるかどうか。
IFilter またはプロトコル ハンドラーに従ってプロパティをグループ化する、クロールされたプロパティのカテゴリ。 クロールされたプロパティのカテゴリを編集すると、その変更は、カテゴリ内のすべてのクロールされたプロパティに適用されます。 このため、検索インデックスへのアイテムの保存方法が影響を受ける場合があります。
検索スキーマの更新内容は、1 分間隔で検索システムに反映されます。
複数の検索スキーマ
複数の検索スキーマを作成できます。 メイン検索スキーマは Search サービス アプリケーションで定義され、サーバーの全体管理で編集できます。 サイト コレクション管理者とテナント管理者は、特定のサイト コレクションまたはテナントの検索スキーマを変更できます。 たとえば、サイト コレクション管理者は、そのサイト コレクションの検索スキーマを変更することで、検索インデックスに含まれるものをカスタマイズし、これを行うことで、そのサイト コレクションの検索エクスペリエンスをカスタマイズできます。 サイト所有者は検索スキーマを表示できますが、変更することはできません。
注:
サーバーの全体管理 でサイト コレクションの検索スキーマを表示または変更することはできません。 サイト コレクションの検索スキーマを表示または変更するには、サイト コレクションの管理を使用する必要があります。
検索インデックス
検索インデックスは、サーバー上のフォルダー内の一連のファイルで構成されます。 コンテンツ処理コンポーネントは、クロールされたアイテムを処理し、検索スキーマを使用してクロールされたプロパティを管理プロパティにマップし、管理プロパティの形式を検索インデックスに書き込む形式に変換します。 取得可能およびクエリ可能としてマークされた管理プロパティには、さまざまなフルテキスト インデックスのほか、個別のインデックスがあります。 また、属性ベクター用の個別のインデックスや、数値インデックスもあります。
インデックス更新グループ
アイテムが変更されたら必ず、クロール後に再度インデックスを作成する必要があります。 SharePoint Serverには、再インデックスの読み込みの負荷を軽減する目的で個別のインデックス更新グループが複数用意されています。
既定 管理プロパティの大部分が含まれます。 このインデックス更新グループには、他のインデックス更新グループ (セキュリティ、リンク、使用状況、またはユーザー) に属さないすべての管理プロパティが含まれます。
セキュリティ ドキュメントのアクセス制御リスト (ACL) 管理プロパティが含まれます。
リンク リンク構造に関連する管理プロパティが含まれます。
使用状況 使用状況データに関連する管理プロパティが含まれます。
ユーザー 人の検索に関連する管理プロパティが含まれます。
各更新グループが、検索インデックスのそれぞれのフォルダーに格納されています。
フルテキスト インデックス
フルテキスト インデックスには、そのフルテキスト インデックスに格納されている検索可能な管理プロパティのすべてのテキストが含まれます。 各フルテキスト インデックスは、重みグループ (コンテキストとも呼ばれます) に分割されます。 さまざまなコンテキストは、管理プロパティの相対的な重要度に関連します。これは、検索結果の合計関連性ランクの計算に使用されるランク付け機能の 1 つです。 コンテキストの番号 (ID) は重要ではありません。ランク付けモデルは、特定のコンテキストにコントリビューションの重みを割り当てることによって、相対的な重要度を決定します。 貢献度の重みが高いほど、ランク付けスコアが高くなります。 詳細は、記事 SharePoint Server での検索結果の概要 の「 検索スキーマを使用した検索結果のランキングの調整」セクションをご覧ください。
既定のフルテキスト インデックス以外に、定義済みフルテキスト インデックスが 2 つあります:SharePoint Terms フルテキスト インデックス (SpTermsIdx) と People インデックス (PeopleIdx) です。
ほとんどの管理プロパティは既定で適切なコンテキストとフルテキスト インデックスに既にマップされています。 検索可能な既存の管理プロパティのコンテキストを変更することはお勧めしません。
管理プロパティの設定の概要
管理プロパティの設定により、検索インデックスへのコンテンツの保存方法およびコンテンツの検索と取得の条件と方法が特定されます。
検索スキーマは サーバーの全体管理、サイト コレクション管理、テナント管理で編集できます。 サイト管理者は検索スキーマを表示できますが、編集はできません。 次の表は、管理プロパティの各種設定と、その設定をさまざまな管理者レベルで編集できるかどうかを示しています。
管理プロパティの設定 | 目的 | 例 | 使用できる場所 | 設定変更後に必要なフル クロールまたは再インデックス化 SharePoint リスト/ライブラリ。 |
---|---|---|---|---|
検索可能 | 管理プロパティのコンテンツに対してクエリを実行できるようにします。 この管理プロパティのコンテンツは、フルテキスト インデックスに含まれます。 | プロパティが "author" の場合、"Smith" に対する簡単なクエリを実行すると、単語 "Smith" が含まれるアイテムと、author プロパティに "Smith" が含まれるアイテムが返されます。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | はい |
詳細検索設定 | 管理プロパティが書き込まれるフルテキスト インデックスを表示および変更できるようにします。 関連性のランクの計算で使用する管理プロパティのコンテキストを変更することもできます。 既存の管理プロパティのコンテキストを変更することはお勧めしません。 詳細は、記事 SharePoint Server での検索結果の概要 の「 検索スキーマを使用した検索結果のランキングの調整」セクションをご覧ください。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | はい | |
クエリ可能 | 特定の管理プロパティに対するクエリを有効にします。 管理プロパティ名は、クエリ自体で指定するか、プログラムによってクエリに含まれるか、クエリに含まれている必要があります。 | 管理プロパティが "author" の場合、クエリでは "author:Smith" を指定する必要があります。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | 無効から有効。 |
取得可能 | この管理プロパティのコンテンツを検索結果で返せるようにします。 関連する管理プロパティのこの設定を、検索結果に表示できるようにします。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | 無効から有効。 | |
複数値の受け入れが可能 | 同じ種類の複数の値をこの管理プロパティで利用できるようにします。 | これが "author" 管理プロパティで、ドキュメントに複数の作成者が含まれる場合は、各作成者の名前が個別の値として管理プロパティに格納されます。 | サーバーの全体管理 | はい |
絞り込み可能 | はい - アクティブ: フロントエンドでプロパティを検索結果の絞り込み条件として使用できるようにします。 Web パーツで絞り込み条件を手動で構成する必要があります。 はい - 最新: フル クロールを再実行せずに、後で絞り込み可能からアクティブに切り替えられるようにします。 両オプションとも、フル クロールを有効にする必要があります。 重要: [はい - アクティブ] または [はい - 潜在] を選択した場合は、管理プロパティをクエリ可能に設定する必要があります。 最新の検索エクスペリエンスではサポートされていません。 |
"author" 管理プロパティが絞り込み可能に設定されている場合、検索フロントエンドで、Author を絞り込み条件として後で設定できます。 | サーバーの全体管理 | 無効から有効 (まだ並べ替え可能に設定していない場合)。 |
並べ替え可能 | はい - アクティブ: 結果セットが返される前に、プロパティに基づいて結果セットを並べ替えられるようにします。 はい - 最新: フル クロールを再実行せずに、後で並べ替えからアクティブに切り替えられるようにします。 両オプションとも、フル クロールを有効にする必要があります。 最新の検索エクスペリエンスではサポートされていません。 |
並べ替えと取得を同時に実行できない大きな結果セットに対して使用します。 | サーバーの全体管理 | 無効から有効 (まだ絞り込み可能に設定していない場合)。 |
エイリアス | クエリおよび検索結果で管理プロパティの名前ではなくエイリアスを使用する必要がある場合に、管理プロパティのエイリアスを定義します。 クロールされたプロパティへのマップには、エイリアスではなく元の管理プロパティを使用します。 | 新しい管理プロパティを作成する必要がない場合、または作成するアクセス許可がない場合に、エイリアスを使用します。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | いいえ |
トークンの正規化 | クエリで使用される大文字と小文字の違いや分音記号に関係なく、結果を返せるようにします。 | クエリ "curacao" は、"Curacao"、"curacao"、および "Curacao" とも一致します。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | はい |
完全一致 | 既定では、search は、管理プロパティと管理プロパティのコンテンツに対するクエリ間の部分的な一致を返します。 検索で完全一致を選択して、代わりに完全一致を返します。 |
管理プロパティ "Title" に "Contoso Sites" が含まれている場合、クエリ Title: "Contoso Sites" のみが結果を返します。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | はい |
言語に依存しないトークン化 (SharePoint Server 2019 のみ) | 多言語コンテンツがあり、管理プロパティにメタデータ用語セットまたはその他の識別子に基づくタグが含まれている場合は、言語に依存しないトークン化を選択します。 既定では、検索は、クエリとコンテンツをパーツに分割する (トークン化) 場合の言語によって異なります。 たとえば、製品識別子に英数字以外の文字 ("11.132-84-115#4" など) がある英語と中国語の両方の製品データシートを含むドキュメント ライブラリです。 検索によってデータシートが処理されると、その言語が検出され、その言語に従ってその中 のすべてのデータ がトークン化されます。 ユーザーが製品識別子を検索すると、検索によって、使用している SharePoint サイトの言語設定に従ってクエリがトークン化されます。 サイトが英語に設定されていて、ユーザーが中国語のテキストとしてトークン化された製品識別子を検索した場合、トークンが一致 しない可能性があり 、ユーザーは結果を取得しません。 ユーザーにとってより良い結果を得るには、製品識別子のクロールされたプロパティを、言語に依存しないトークン化が有効になっている新しい管理プロパティ "ProductID" にマップします。 ProductID:"11.132-8" のように、新しい管理プロパティに対して製品識別子を検索するようにユーザーに指示します。 |
製品識別子のクロールされたプロパティがマネージド プロパティ "ProductID" にマップされている場合、検索では "ProductID" に対するクエリに対して言語に依存しないトークン化が使用されます。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | はい |
より細かいクエリ トークン化 (SharePoint Server 2019 のみ) | この設定を使用すると、ユーザーが英数字以外の文字を含むメタデータを含む管理プロパティで検索するときに、検索結果が向上します。 この設定により、管理プロパティに対するクエリの速度が低下します。 クエリをすばやく入力し、その結果を参照して目的のデータシートを検索するユーザーは、通常、ProductID:"132-884" のようなクエリを入力します。 既定で検索すると、検索インデックスのコンテンツがクエリよりも小さい部分に分割されるため、検索でこれらのクエリの一致が見つからない場合があります。 クエリがより細かくトークン化されると、検索インデックスとクエリ内のトークンの間に一致が存在する可能性が高くなります。 ユーザーは、製品識別子の中央または最後の部分に対してクエリを実行することもできます。 データシートを検索し、完全な製品識別子に一致する結果のみを取得することを想定しているユーザーは、通常、ProductID:"11.132-884-115#4" のようなクエリを記述します。 クエリ トークン化を細かくしても、このようなクエリに違いはありません。 |
"11.132-884-115#4" を含む管理プロパティ "Product identifier" がある場合は、ProductID:"132-884" のような検索で結果が得られる可能性があります。 | サーバーの全体管理/サイト コレクションの管理/テナント管理 | いいえ |
クロールされたプロパティへのマッピング | リストには、この管理プロパティにマップされているクロールされたプロパティの一覧が表示されます。 管理プロパティは、1 つ以上のクロールされたプロパティからコンテンツを取得します。 指定された順序に基づいて、クロールされたすべてのプロパティのコンテンツ、またはクロールされた最初の空でないプロパティのコンテンツを含めるように設定できます。 |
サーバーの全体管理/サイト コレクションの管理/テナント管理 | はい | |
会社名の抽出 | システムが新しいアイテムまたは更新されたアイテムをクロールするときに、管理プロパティから会社名エンティティを抽出できるようにします。 抽出されたエンティティを使用すると、後から絞り込み条件を設定できます。 会社名の抽出に対して 1 つの事前入力された辞書があります。 元の管理プロパティのコンテンツはそのままの状態でインデックスに保存され、さらに、抽出されたエンティティが管理プロパティ "companies" にコピーされます。 "companies" 管理プロパティは、検索可能、クエリ可能、取得可能、並べ替え可能、絞り込み可能として構成されます。 会社名の辞書は、用語ストアで編集できます。 詳細については、「SharePoint Server で会社名の抽出を管理する」をご覧ください。 最新の検索エクスペリエンスではサポートされていません。 |
サーバーの全体管理/サイト コレクションの管理/テナント管理 | はい | |
ユーザー定義エンティティの抽出 | 1 つ以上のユーザー定義エンティティの抽出をこの管理プロパティに関連付けられるようにします。 これにより、新しいアイテムまたは更新されたアイテムをクロールするときに、システムが管理プロパティからエンティティを抽出できます。 抽出されたエンティティを使用すると、後から絞り込み条件を設定できます。 詳細については、「SharePoint Server でカスタム エンティティ抽出を作成および展開する」を参照してください。 最新の検索エクスペリエンスではサポートされていません。 |
サーバーの全体管理/サイト コレクションの管理 | はい |
関連項目
SharePoint Server で検索スキーマを管理する