Обзор схемы поиска в SharePoint Server

 

**Применимо к:**SharePoint Server 2013, SharePoint Server 2016

**Последнее изменение раздела:**2017-07-24

Сводка. Познакомьтесь с использованием схемы поиска для создания индекса поиска. Схема поиска содержит сопоставление свойств для обхода управляемым свойствам, а также настройки управляемых свойств.

Индекс поиска является центром поиска. Именно он определяет, что люди будут находить при поиске информации, вводя запросы поиска или взаимодействуя с Интернет- или интрасеть-страницами.

В этой статье описывается процесс сбора и извлечения контента из индекса поиска с помощью схемы поиска. Схема поиска содержит свойства для обхода, категории свойств для обхода, сопоставление свойств для обхода управляемым свойствам и настройки управляемых свойств. Настройки управляемых свойств определяют, что и как можно искать, например, если вы можете выполнять уточнение или делать запрос к свойству.

В этой статье

  • Обход и свойства для обхода

  • Управляемые свойства и сопоставление свойств

  • Схема поиска

  • Индекс поиска

  • Обзор настроек управляемых свойств

Обход и свойства для обхода

Для создания индекса поиска необходимо сначала выполнить обход контента. Можно выполнить обход различных источников контента, например контента SharePoint Server, общих папок или профилей пользователей. Контент и метаданные элементов, используемых для обхода, представляются как свойства для обхода.

Каждый элемент, задействованный в обходе и переданный компоненту обработки контента, обладает связанными с ним свойствами для обхода. Примерами таких свойств являются Автор, Название и Дата создания. Все новые свойства для обхода будут обнаружены автоматически.

Свойства для обхода группируются в категории, основанные на интерфейсе IFilter или обработчике протокола для элемент. Примером категорий являются Office (свойства для обхода из документов Word, листов Excel и т. д.), Бизнес-данные (свойства для обхода из примеров баз данных) и Веб (свойства для обхода из веб-сайтов).

Подробнее об обходе см. в статье Планирование обхода контента и федерации в SharePoint Server.

Управляемые свойства и сопоставления свойств

Чтобы включить в индекс поиска контент и метаданные свойств для обхода, необходимо сопоставить свойства для обхода управляемым свойствам. В индекс поиска записываются только управляемые свойства.

У управляемых свойств может быть множество параметров. Настройки управляемого свойства определяют представление контента в результатах поиска и то, как люди могут выполнять его поиск.

Одному управляемому свойству можно сопоставить несколько свойств для обхода. Например, можно сопоставить свойства для обхода "Писатель" и "Автор" управляемому свойству "Автор". Либо можно сопоставить одно свойство для обхода нескольким управляемым свойствам.

Кроме того, порядок, в котором свойства для обхода сопоставляются управляемым свойствами, может определять контент управляемого свойства. Например, управляемое свойство может иметь несколько свойств для обхода, сопоставленных ему, и может содержать все значения из всех свойств для обхода, сопоставленных ему. Но если свойству для обхода, которое содержит заголовок SharePoint, предоставить приоритет над другими заголовками в сопоставлении, первым в результатах поиска будет отображаться заголовок SharePoint.

Определен набор сопоставлений по умолчанию между свойствами для обхода и управляемыми свойствами, см. статью Обзор свойств для обхода и управляемых свойств в SharePoint Server.

Для некоторых типов свойств для обхода автоматически создается новое управляемое свойство и сопоставление между свойством для обхода и управляемым свойством. Например, это автоматическое создание выполняется для всех столбцов сайтов из библиотек SharePoint. После создания столбца сайта в списке при обходе этого списка для столбца сайта автоматически создаются свойство для обхода, управляемое свойство и сопоставление между ними.

Вы можете изменять сопоставление по умолчанию или другое сопоставление свойств для обхода и управляемых свойств, а также создавать новые сопоставления и новые управляемые свойства. При создании нового управляемого свойства или изменении определенных параметров существующих управляемых свойств необходимо выполнить полный обход перед включением управляемого свойства и его значения в индекс поиска. Если новые или измененные свойства находятся в библиотеке или списке SharePoint, вы можете выполнить переиндексацию соответствующей библиотеки или соответствующего списка без полного обхода всего источника контента SharePoint. Это соответствует полному обходу.

Подробнее см. в таблице Обзор настроек управляемых свойств далее в этой статье.

Схема поиска

Схема поиска хранится в базе данных администрирования поиска (Search Administration). Схема поиска содержит нижеперечисленные элементы.

  • Сопоставление между свойствами для обхода и управляемыми свойствами. Сопоставлять можно одно свойство для обхода одному управляемому свойству, одно свойство для обхода нескольким управляемым свойствам, несколько свойств для обхода одному управляемому свойству, и даже несколько свойств для обхода нескольким управляемым свойствам.

  • Способ, используемый для записи управляемых свойств в индекс поиска. Например, в какой полнотекстовый индекс и в какую группу взвешивания (контекст) должны записываться значения управляемых свойств.

  • Настройки других управляемых свойств. Например, при поиске, запросе или уточнении результатов поиска с помощью конкретных управляемых свойств.

  • Категории свойств для обхода, которые группируют свойства на основании обработчика IFilter или обработчика протокола. Изменения категории свойств для обхода применяются ко всем свойствам этой категории. Это может повлиять на производительность и способ сохранения элементов в индексе поиска.

Обновления схемы поиска распространяются в системе поиска ежеминутно.

Несколько схем поиска

Вы можете создать несколько схем поиска. Главная схема поиска определена в приложении-службе поиска и может быть изменена, используя центр Центр администрирования. Администраторы семейств сайтов и администраторы клиента могут изменить схему поиска для конкретного семейства сайтов или клиента. Например, администратор семейства сайтов может настроить данные, включаемые в индекс поиска, меняя схему поиска для этого семейства сайтов, и, таким образом, настроить работу поиска для этого семейства сайтов. Владельцы сайтов могут просматривать схему поиска, но не могут изменять ее.

Примечание

В центре Центр администрирования нельзя просматривать и изменять схему поиска семейства сайтов. Чтобы просмотреть схему поиска для семейства сайтов или внести в нее изменения, необходимо использовать меню "Администрирование семейства веб-сайтов".

Индекс поиска

Индекс поиска состоит из набора файлов в папках на сервере. Компонент обработки контент обрабатывает элементы, задействованные при обходе, и преобразует управляемые свойства в формат, записываемый в индекс поиска. Кроме различных полнотекстовых индексов, существуют отдельные индексы управляемых свойств, помеченных как доступные для извлечения и как доступные для запроса. Кроме того, существует отдельный индекс для векторов атрибутов и числовые индексы.

Группы изменения индекса

При каждом изменении элемент (после его следующего обхода) должен индексироваться заново. Чтобы уменьшить нагрузку, создаваемую повторным индексированием, в SharePoint Server введены несколько отдельных групп изменения индекса.

  • По умолчанию. Содержит большинство управляемых свойств. Эта группа изменения индекса содержит все управляемые свойства, не входящие в группы изменения индекса "Безопасность", "Ссылка", "Использование" или "Люди".

  • Безопасность. Содержит управляемое свойство списка управления доступом (ACL) документа

  • Ссылка. Содержит управляемые свойства, относящиеся к структуре ссылок

  • Использование. Содержит управляемые свойства, относящиеся к данным об использовании

  • Люди. Содержит управляемые свойства, относящиеся к поиску людей

Каждая группа изменения хранится в отдельной папку индекса поиска.

Полнотекстовый индекс

Полнотекстовый индекс содержит весь текст из входящих в него управляемых свойств, поддерживающих поиск. Каждый полнотекстовый индекс делится на группы веса, также называемые контекстами. Различные контексты связаны с разным весом управляемого свойства, используемого для вычисления общего ранга релевантности результата поиска. Номер или идентификатор контекста не имеет веса. модель ранжирования определяет свой относительный вес, назначая вес участия определенному контексту. Более высокий вес участия означает более высокий ранг. Подробнее см. в разделе Влияние ранжирования результатов поиска с использованием схемы поиска статьи Обзор ранжирования результатов поиска в SharePoint Server.

Существует два предопределенных полнотекстовых индекса, отличающихся от полнотекстового индекса по умолчанию: полнотекстовый индекс терминов SharePoint (SpTermsIdx) и индекс людей (PeopleIdx).

Большинство управляемых свойств уже сопоставлены с подходящим контекстом и полнотекстовым индексом по умолчанию. Мы не рекомендуем изменять контекст какого-либо из имеющихся управляемых свойств, поддерживающих поиск.

Обзор настроек управляемых свойств

Настройки управляемых свойств определяют способ сохранения контента в индексе поиска и то, как пользователи смогут выполнять поиск контента и извлекать его.

Схему поиска можно изменить с помощью центра Центр администрирования, администрирования семейства сайтов и администрирования клиентов. Администраторы сайтов могут просматривать схему поиска, но не могут редактировать ее. В следующей таблице описываются различные настройки и их доступность для редактирования администраторами различных уровней.

Параметр управляемого свойства Действие Пример Доступен в Полный обход или переиндексация библиотеки или списка SharePoint, которые требуются после изменения параметров

Возможность поиска

Разрешает запросы к содержимому управляемого свойства. Содержимое управляемого свойства включается в полнотекстовый индекс.

Если свойством является "автор", простой запрос "Егоров" возвращает элементы, содержащие слово "Егоров", и элементы, у которых свойство "автор" содержит "Егоров".

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Да

Дополнительные параметры возможности поиска

Разрешает просмотр и изменение полнотекстового индекса, в который записывается управляемое свойство. Кроме того, позволяет изменять контекст управляемого свойства для расчета ранга релевантности. Мы не рекомендуем изменять контекст какого-либо из имеющихся управляемых свойств. Подробнее см. в разделе Влияние на ранжирование результатов поиска с помощью схемы поиска статьи Обзор ранжирования результатов поиска в SharePoint Server.

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Да

Возможность запроса

Разрешает выполнение запроса к конкретному управляемому свойству. Имя управляемого свойства должно быть включено в запрос, будучи либо указанным в самом запросе, либо включаемым в запрос программно.

Если управляемым свойством является "автор", запрос должен содержать"автор:Егоров".

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Из отключенного состояние во включенное

Возможность извлечения

Разрешает возвращать контент этого управляемого свойства в результатах поиска. Включите этот параметр для управляемых свойств, которые должны присутствовать в результатах поиска.

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Из отключенного состояние во включенное

Разрешить использование нескольких значений

Разрешает использовать несколько значений одного типа в этом управляемом свойстве.

Если управляемым свойством является "автор" и у документа несколько авторов, имя каждого автора будет сохранено в управляемом свойстве как отдельное значение.

Центр администрирования

Да

Возможность уточнения

Да — активно: позволяет использовать свойство в качестве уточнения для результатов поиска в интерфейсе. Необходимо вручную настроить уточнение в веб-части.

Да — готово: позволяет переключить возможность уточнения в активное состояние позднее, без необходимости выполнять полный повторный обход при переключении.

В обоих случаях для вступления в силу требуется полный обход контента.

Важно!

Если выбрано значение "Да — активно" или "Да — готово", необходимо также включить для управляемого свойства возможность запроса.

Если для управляемого свойства “автор” включена возможность уточнения, можно позднее настроить свойство "автор" как уточнение в интерфейсе поиска.

Центр администрирования

Из отключенного состояние во включенное (если еще не установлена возможность сортировки)

Возможность сортировки

Да — активно: разрешает сортировку набора результатов на основе свойства перед возвращением набора результатов.

Да — готово: позволяет переключить возможность сортировки в активное состояние позднее, без необходимости выполнять полный повторный обход при переключении.

В обоих случаях для вступления в силу требуется полный обход контента.

Используется для больших наборов контента, которые невозможно вернуть и отсортировать одновременно.

Центр администрирования

Из отключенного состояние во включенное (если еще не установлена возможность уточнения)

Псевдоним

Определяет псевдоним управляемого свойства, если в запросах и результатах поиска нужно использовать псевдоним вместо имени управляемого свойства. Для сопоставления свойству для обхода необходимо использовать оригинальное управляемое свойство, но не псевдоним.

Используйте псевдоним, если нежелательно создавать новое управляемое свойство или отсутствует соответствующее разрешение.

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Нет

Нормализация маркеров

Позволяет возвращаемым результатам не зависеть от регистра букв и диакритических значков, используемых в запросе.

Запрос "полет" будет также соответствовать значениям "Полёт", "полет" и "Полет".

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Да

Полное соответствие

Запросы будут соответствовать только точному контенту свойства.

При использовании управляемого свойства "ID", содержащего строку "1-23-456#7", полное соответствие обеспечивает для запроса возвращение только результата ID:"1-23-456#7", но не результатов ID:"1-23" и ID:"1 23 456 7".

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Да

Сопоставления свойствам для обхода

В этом списке приведены все свойства для обхода, сопоставляемые этому управляемому свойству. Управляемое свойство может получать свой контент из одного или нескольких свойств для обхода.

Можно либо включить контент из всех свойств для обхода или включить контент из первого непустого свойства для обхода на основе указанного порядка.

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Да

Извлечение имен компаний

Разрешает системе при обходе новых или измененных элементов извлекать объекты имен компаний из управляемого свойства. Извлеченные объекты можно позднее использовать для настройки уточнений.

Существует один заранее заполненный словарь для извлечения имен компаний. Система сохраняет оригинальный контент управляемого свойства в индексе неизменным и, кроме того, копирует объекты в управляемое свойство "companies" (компании). Для управляемого свойства "companies" включены возможности поиска, запроса, извлечения, сортировки и уточнения.

Словарь имен компаний можно изменить в хранилище терминов.

Подробнее см. в статье Управление извлечением названия организации в SharePoint Server.

Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов

Да

Извлечение пользовательских объектов

Разрешает связать с этим управляемым свойством одно или несколько средств извлечения пользовательских объектов. Это позволяет системе извлекать объекты из управляемого свойства при обходе новых или измененных элементов. Извлеченные элементы можно позднее использовать для настройки уточнений.

Подробнее см. в статье Создание и развертывание пользовательских средств извлечения объектов в SharePoint Server.

Центр Центр администрирования / Администрирование семейства сайтов

Да

See also

Управление схемой поиска в SharePoint Server
Обзор свойств для обхода и управляемых свойств в SharePoint Server
Планирование обхода контента и федерации в SharePoint Server