Обзор схемы поиска в SharePoint Server
ОБЛАСТЬ ПРИМЕНЕНИЯ:2013 2016 2019 Subscription Edition SharePoint в Microsoft 365
Индекс поиска является центром поиска. Именно он определяет, что люди будут находить при поиске информации, вводя запросы поиска или взаимодействуя с Интернет- или интрасеть-страницами.
В этой статье описывается процесс сбора и извлечения контента из индекса поиска с помощью схемы поиска. Схема поиска содержит свойства для обхода, категории свойств для обхода, сопоставление свойств для обхода управляемым свойствам и настройки управляемых свойств. Настройки управляемых свойств определяют, что и как можно искать, например, если вы можете выполнять уточнение или делать запрос к свойству.
Обход и свойства для обхода
Для создания индекса поиска необходимо сначала выполнить обход контента. Можно выполнить обход различных источников контента, например контента SharePoint Server, общих папок или профилей пользователей. Контент и метаданные элементов, используемых для обхода, представляются как свойства для обхода.
Каждый элемент, задействованный в обходе и переданный компоненту обработки контента, обладает связанными с ним свойствами для обхода. Примерами таких свойств являются Автор, Название и Дата создания. Все новые свойства для обхода будут обнаружены автоматически.
Свойства для обхода группируются в категории, основанные на интерфейсе IFilter или обработчике протокола для элемент. Примерами категорий являются Office (свойства для обхода из документов Word, листы Excel и т. д.), бизнес-данные (свойства для обхода из баз данных) и Интернет (свойства для обхода с веб-сайтов).
Дополнительные сведения об обходе контента см. в статье Планирование обхода контента и федерации в SharePoint Server.
Управляемые свойства и сопоставления свойств
Чтобы включить в индекс поиска контент и метаданные свойств для обхода, необходимо сопоставить свойства для обхода управляемым свойствам. В индекс поиска записываются только управляемые свойства.
У управляемых свойств может быть множество параметров. Настройки управляемого свойства определяют представление контента в результатах поиска и то, как люди могут выполнять его поиск.
Одному управляемому свойству можно сопоставить несколько свойств для обхода. Например, можно сопоставить свойства для обхода "Писатель" и "Автор" управляемому свойству "Автор". Либо можно сопоставить одно свойство для обхода нескольким управляемым свойствам.
Кроме того, порядок, в котором свойства для обхода сопоставляются управляемым свойствами, может определять контент управляемого свойства. Например, управляемое свойство может иметь несколько свойств для обхода, сопоставленных ему, и может содержать все значения из всех свойств для обхода, сопоставленных ему. Но если свойству для обхода, которое содержит заголовок SharePoint, предоставить приоритет над другими заголовками в сопоставлении, первым в результатах поиска будет отображаться заголовок SharePoint.
Набор стандартных сопоставлений между свойствами для обхода и управляемыми свойствами см. в этой статье.
Для некоторых типов свойств для обхода автоматически создается новое управляемое свойство и сопоставление между свойством для обхода и управляемым свойством. Например, это автоматическое создание выполняется для всех столбцов сайтов из библиотек SharePoint. После создания столбца сайта в списке при обходе этого списка для столбца сайта автоматически создаются свойство для обхода, управляемое свойство и сопоставление между ними.
Вы можете изменять сопоставление по умолчанию или другое сопоставление свойств для обхода и управляемых свойств, а также создавать новые сопоставления и новые управляемые свойства. При создании нового управляемого свойства или изменении определенных параметров существующих управляемых свойств необходимо выполнить полный обход перед включением управляемого свойства и его значения в индекс поиска. Если новые или измененные свойства находятся в библиотеке или списке SharePoint, вы можете выполнить переиндексацию соответствующей библиотеки или соответствующего списка без полного обхода всего источника контента SharePoint. Это соответствует полному обходу.
Подробнее см. в таблице Обзор настроек управляемых свойств далее в этой статье.
Схема поиска
Схема поиска хранится в базе данных администрирования поиска (Search Administration). Схема поиска содержит нижеперечисленные элементы.
Сопоставление между свойствами для обхода и управляемыми свойствами. Сопоставлять можно одно свойство для обхода одному управляемому свойству, одно свойство для обхода нескольким управляемым свойствам, несколько свойств для обхода одному управляемому свойству, и даже несколько свойств для обхода нескольким управляемым свойствам.
Способ, используемый для записи управляемых свойств в индекс поиска. Например, в какой полнотекстовый индекс и в какую группу взвешивания (контекст) должны записываться значения управляемых свойств.
Настройки других управляемых свойств. Например, при поиске, запросе или уточнении результатов поиска с помощью конкретных управляемых свойств.
Категории свойств для обхода, которые группируют свойства на основании обработчика IFilter или обработчика протокола. Изменения категории свойств для обхода применяются ко всем свойствам этой категории. Это может повлиять на производительность и способ сохранения элементов в индексе поиска.
Обновления схемы поиска распространяются в системе поиска ежеминутно.
Несколько схем поиска
Вы можете создать несколько схем поиска. Главная схема поиска определена в приложении-службе поиска и может быть изменена, используя центр Центр администрирования. Администраторы семейств сайтов и администраторы клиента могут изменить схему поиска для конкретного семейства сайтов или клиента. Например, администратор семейства сайтов может настроить данные, включаемые в индекс поиска, меняя схему поиска для этого семейства сайтов, и, таким образом, настроить работу поиска для этого семейства сайтов. Владельцы сайтов могут просматривать схему поиска, но не могут изменять ее.
Примечание.
[!Примечание] В центре Центр администрирования нельзя просматривать и изменять схему поиска семейства сайтов. Чтобы просмотреть схему поиска для семейства сайтов или внести в нее изменения, необходимо использовать меню "Администрирование семейства веб-сайтов".
Индекс поиска
Индекс поиска состоит из набора файлов в папках на сервере. Компонент обработки контент обрабатывает элементы, задействованные при обходе, и преобразует управляемые свойства в формат, записываемый в индекс поиска. Кроме различных полнотекстовых индексов, существуют отдельные индексы управляемых свойств, помеченных как доступные для извлечения и как доступные для запроса. Кроме того, существует отдельный индекс для векторов атрибутов и числовые индексы.
Группы изменения индекса
При каждом изменении элемент (после его следующего обхода) должен индексироваться заново. Чтобы уменьшить нагрузку, создаваемую повторным индексированием, в SharePoint Server введены несколько отдельных групп изменения индекса.
По умолчанию Содержит большинство управляемых свойств. Эта группа изменения индекса содержит все управляемые свойства, не входящие в группы изменения индекса "Безопасность", "Ссылка", "Использование" или "Люди".
Безопасность. Содержит управляемое свойство списка управления доступом (ACL) документа
Ссылка. Содержит управляемые свойства, относящиеся к структуре ссылок
Использование. Содержит управляемые свойства, относящиеся к данным об использовании
Люди. Содержит управляемые свойства, относящиеся к поиску людей
Каждая группа изменения хранится в отдельной папку индекса поиска.
Полнотекстовый индекс
В полнотекстовом индексе содержится весь текст управляемых свойств, поддерживающих поиск, которые сохраняются в этом полнотекстовом индексе. Каждый полнотекстовый индекс делится на группы взвешивания, также называемые контекстами. Различные контексты связаны с относительной важностью управляемого свойства, которое является одним из признаков ранжирования, используемых для вычисления общего ранга релевантности результата поиска. Номер или идентификатор контекста не важны; модель ранжирования определяет его относительную важность путем присвоения определенному контексту значимого веса. Более высокие показатели значимого веса приводят к более высокому ранжированию. Дополнительные сведения см. в разделе Влияние на ранжирование результатов поиска с помощью схемы поискастатьи Обзор ранжирования результатов поиска в SharePoint Server.
Существует два предопределенных полнотекстовых индекса, отличающихся от стандартного полнотекстового индекса: полнотекстовый индекс терминов SharePoint (SpTermsIdx) и индекс людей (PeopleIdx).
Большинство управляемых свойств уже сопоставлены с подходящим контекстом и полнотекстовым индексом по умолчанию. Мы не рекомендуем изменять контекст какого-либо из имеющихся управляемых свойств, поддерживающих поиск.
Обзор настроек управляемых свойств
Настройки управляемых свойств определяют способ сохранения контента в индексе поиска и то, как пользователи смогут выполнять поиск контента и извлекать его.
Схему поиска можно изменить с помощью центра Центр администрирования, администрирования семейства сайтов и администрирования клиентов. Администраторы сайтов могут просматривать схему поиска, но не могут редактировать ее. В следующей таблице описываются различные настройки и их доступность для редактирования администраторами различных уровней.
Параметр управляемого свойства | Действие | Пример | Доступен в | Полный обход или переиндексация библиотеки или списка SharePoint, которые требуются после изменения параметров |
---|---|---|---|---|
Возможность поиска | Разрешает запросы к содержимому управляемого свойства. Содержимое управляемого свойства включается в полнотекстовый индекс. | Если свойством является "автор", простой запрос "Егоров" возвращает элементы, содержащие слово "Егоров", и элементы, у которых свойство "автор" содержит "Егоров". | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Да |
Дополнительные параметры возможности поиска | Разрешает просмотр и изменение полнотекстового индекса, в который записывается управляемое свойство. Кроме того, позволяет изменять контекст управляемого свойства для расчета ранга релевантности. Мы не рекомендуем изменять контекст какого-либо из имеющихся управляемых свойств. Дополнительные сведения см. в разделе Влияние на ранжирование результатов поиска с помощью схемы поискастатьи Обзор ранжирования результатов поиска в SharePoint Server. | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Да | |
Возможность запроса | Разрешает выполнение запроса к конкретному управляемому свойству. Имя управляемого свойства должно быть включено в запрос, будучи либо указанным в самом запросе, либо включаемым в запрос программно. | Если управляемым свойством является "автор", запрос должен содержать"автор:Егоров". | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Из отключенного состояние во включенное |
Возможность извлечения | Разрешает возвращать контент этого управляемого свойства в результатах поиска. Включите этот параметр для управляемых свойств, которые должны присутствовать в результатах поиска. | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Из отключенного состояние во включенное | |
Разрешить использование нескольких значений | Разрешает использовать несколько значений одного типа в этом управляемом свойстве. | Если управляемым свойством является "автор" и у документа несколько авторов, имя каждого автора будет сохранено в управляемом свойстве как отдельное значение. | Центр администрирования | Да |
Возможность уточнения | Да активно: позволяет использовать свойство в качестве уточнения для результатов поиска в интерфейсе. Необходимо вручную настроить уточнение в веб-части. Да — готово: позволяет переключить возможность уточнения в активное состояние позднее, без необходимости выполнять полный повторный обход при переключении. В обоих случаях для вступления в силу требуется полный обход контента. ВАЖНО! Если выбрано значение "Да активно" или "Да готово", необходимо также включить для управляемого свойства возможность запроса. Не поддерживается в современном интерфейсе поиска. |
Если для управляемого свойства "автор" включена возможность уточнения, можно позднее настроить свойство "автор" как уточнение в интерфейсе поиска. | Центр администрирования | Из отключенного состояние во включенное (если еще не установлена возможность сортировки) |
Возможность сортировки | Да активно: разрешает сортировку набора результатов на основе свойства перед возвращением набора результатов. Да готово: позволяет переключить возможность сортировки в активное состояние позднее, без необходимости выполнять полный повторный обход при переключении. В обоих случаях для вступления в силу требуется полный обход контента. Не поддерживается в современном интерфейсе поиска. |
Используется для больших наборов контента, которые невозможно вернуть и отсортировать одновременно. | Центр администрирования | Из отключенного состояние во включенное (если еще не установлена возможность уточнения) |
Псевдоним | Определяет псевдоним управляемого свойства, если в запросах и результатах поиска нужно использовать псевдоним вместо имени управляемого свойства. Для сопоставления свойству для обхода необходимо использовать оригинальное управляемое свойство, но не псевдоним. | Используйте псевдоним, если нежелательно создавать новое управляемое свойство или отсутствует соответствующее разрешение. | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Нет |
Нормализация маркеров | Позволяет возвращаемым результатам не зависеть от регистра букв и диакритических значков, используемых в запросе. | Запрос "полет" будет также соответствовать значениям "Полёт", "полет" и "Полет". | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Да |
Полное соответствие | По умолчанию поиск возвращает частичные совпадения между запросами к управляемому свойству и содержимому управляемого свойства. Выберите Завершить сопоставление для поиска, чтобы вернуть точные совпадения. |
Если управляемое свойство Title содержит "Сайты Contoso", результат будет давать только запрос Title: "Сайты Contoso". | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Да |
Токенизация с нейтральным языком (только SharePoint Server 2019) | Выберите не зависящий от языка маркеризацию, если у вас многоязычное содержимое, а управляемое свойство содержит теги, основанные на наборах терминов метаданных или других идентификаторах. По умолчанию поиск зависит от языка, когда он разбивает запросы и содержимое на части (токенизация). Например, библиотека документов, содержащая таблицы продуктов на английском и китайском языках, в которых идентификаторы продуктов содержат не буквенно-цифровые символы, например "11.132-84-115#4". Когда поиск обрабатывает таблицу, она обнаруживает ее язык и токенизирует все в ней в соответствии с этим языком. Когда пользователи ищут идентификатор продукта, поиск токенизирует свой запрос в соответствии с языковым параметром сайта SharePoint, на который они используются. Если для сайта задано значение "Английский", а пользователь ищет идентификатор продукта, который был токенизирован как текст на китайском языке, маркеры могут не совпадать, и пользователи не получают результатов. Чтобы улучшить результаты для пользователей, сопоставьте свойство для идентификатора продукта для обхода с новым управляемым свойством ProductID с включенной маркеризацией, не зависящим от языка. Попросите пользователей искать идентификаторы продуктов для нового управляемого свойства, например ProductID:"11.132-8". |
Если свойство для идентификатора продукта для обхода сопоставлено с управляемым свойством ProductID, то поиск использует не зависящий от языка токенизации для запросов к ProductID. | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Да |
Более тонкая токенизация запросов (только SharePoint Server 2019) | Используйте этот параметр, чтобы помочь пользователям получать лучшие результаты поиска при поиске в управляемых свойствах, содержащих метаданные с символами, не содержащими буквенно-цифровые символы. Этот параметр замедляет выполнение запросов к управляемому свойству. Пользователи, которые предпочитают быстро ввести запрос, а затем просмотреть результаты, чтобы найти таблицу, которую они ищут, обычно вводят запросы, такие как ProductID:"132-884". Поскольку поиск по умолчанию разбивает содержимое индекса поиска на более мелкие части, чем для запросов, поиск может не найти совпадений для этих запросов. При более точной маркеризации запроса более вероятно, что между маркерами в индексе поиска и запросе имеются совпадения. Пользователи также могут запрашивать среднюю или последнюю часть идентификатора продукта. Пользователи, которые ищут таблицу и ожидают получить только результаты, соответствующие полному идентификатору продукта, обычно пишут запросы, такие как ProductID:"11.132-884-115#4". Более тонкая токенизация запросов не влияет на такие запросы. |
Если у вас есть управляемое свойство Product identifier, содержащее "11.132-884-115#4", скорее всего, результаты поиска, например ProductID:"132-884". | Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Нет |
Сопоставления свойствам для обхода | В этом списке приведены все свойства для обхода, сопоставляемые этому управляемому свойству. Управляемое свойство может получать свой контент из одного или нескольких свойств для обхода. Можно либо включить контент из всех свойств для обхода или включить контент из первого непустого свойства для обхода на основе указанного порядка. |
Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Да | |
Извлечение имен компаний | Разрешает системе при обходе новых или измененных элементов извлекать объекты имен компаний из управляемого свойства. Извлеченные объекты можно позднее использовать для настройки уточнений. Существует один заранее заполненный словарь для извлечения имен компаний. Система сохраняет оригинальный контент управляемого свойства в индексе неизменным и, кроме того, копирует объекты в управляемое свойство "companies" (компании). Для управляемого свойства "companies" включены возможности поиска, запроса, извлечения, сортировки и уточнения. Словарь имен компаний можно изменить в хранилище терминов. Подробнее см. в статье Управление извлечением названия организации в SharePoint Server. Не поддерживается в современном интерфейсе поиска. |
Центр Центр администрирования / Администрирование семейства сайтов / Администрирование клиентов | Да | |
Извлечение пользовательских объектов | Разрешает связать с этим управляемым свойством одно или несколько средств извлечения пользовательских объектов. Это позволяет системе извлекать объекты из управляемого свойства при обходе новых или измененных элементов. Извлеченные элементы можно позднее использовать для настройки уточнений. Дополнительные сведения см. в статье Создание и развертывание пользовательских средств извлечения объектов в SharePoint Server. Не поддерживается в современном интерфейсе поиска. |
Центр Центр администрирования / Администрирование семейства сайтов | Да |
См. также
Управление схемой поиска в SharePoint Server
Обзор свойств для обхода и управляемых свойств в SharePoint Server
Планирование обхода контента и федерации в SharePoint Server