Обзор архитектуры поиска в SharePoint Server
**Применимо к:**SharePoint Server 2013, SharePoint Server 2016
**Последнее изменение раздела:**2017-07-24
Сводка. Узнайте об архитектуре, компонентах, базах данных и топологии поиска SharePoint Server.
Архитектура поиска содержит компоненты и базы данных поиска. Структура архитектуры поиска зависит от планируемой области поиска: корпоративная среда или интернет-сайты. При построении архитектуры поиска необходимо учитывать такие факторы, как высокая доступность и отказоустойчивость, объем контента, а также расчетное количество просмотров страниц и запросов в секунду.
Сведения о топологиях поиска для различных сценариев использования см. в статьях Архитектуры поиска в корпоративной среде для SharePoint Server 2016 и Архитектуры поиска на веб-сайтах для SharePoint Server 2016.
В этой статье
Обзор компонентов и баз данных поиска
О компоненте обхода
О компоненте обработки контента
О компоненте обработки аналитических данных
О компоненте индексирования
О компоненте обработки запросов
О компоненте администрирования поиска
О базе данных обхода
О базе данных ссылок
О базе данных аналитических отчетов
О базе данных администрирования поиска
Обзор компонентов и баз данных поиска
В приведенных ниже таблицах представлены общие сведения о доступных компонентах поиска и базах данных поиска. Дополнительные сведения о взаимодействии этих компонентов и баз данных показаны в схеме статьи Архитектуры поиска для SharePoint Server 2016.
Компоненты поиска
Имя компонента поиска | Описание |
---|---|
Компонент обхода |
Выполняет обход контента, собирает свойства для обхода и метаданные из обойденных элементов и отправляет их в компонент обработки контента. |
Компонент обработки контента |
Преобразует обойденные элементы и отправляет их в компонент индексирования. Этот компонент также сопоставляет свойства для обхода с управляемыми свойствами. |
Компонент обработки аналитических данных |
Выполняет анализ поиска и использования. |
Компонент индексирования |
Получает обработанные элементы из компонента обработки контента и записывает их в индекс поиска. Этот компонент также обрабатывает входящие запросы, получает данные из индекса поиска и отправляет набор результатов в компонент обработки запросов. |
Компонент обработки запросов |
Анализирует входящие запросы. Это помогает оптимизировать точность, список возврата и релевантность. Запросы отправляются в компонент индексирования, который возвращает соответствующие наборы результатов поиска. |
Компонент администрирования поиска |
Запускает системные процессы поиска, а также добавляет и инициализирует новые экземпляры компонентов поиска. |
Базы данных поиска
Имя базы данных поиска | Описание |
---|---|
База данных обхода |
Хранит данные отслеживания и накопленные сведения об обойденных элементах, таких как документы и URL-адреса. Также хранит такие сведения, как время последнего обхода, идентификатор последнего обхода и тип обновления (добавление, обновление, удаление) при последнем обходе. |
База данных ссылок |
Хранит необработанные данные, извлеченные компонентом обработки контента, а также сведения об использовании результатов поиска. Компонент обработки аналитических данных анализирует эти данные. |
База данных аналитических отчетов |
Сохраняет результаты анализа использования. |
База данных администрирования поиска |
Сохраняет данные конфигурации поиска. |
О компоненте обхода
Компонент обхода выполняет обход источников контента. Он может обходить различные источники, такие как общие файловые ресурсы, контент SharePoint Server, бизнес-приложения и т. д. Для получения данных компонент обхода подключается к источникам контента, вызывая соответствующий соединитель индексирования или обработчик протокола. После получения контента компонент обхода передает обойденные элементы в компонент обработки контента.
Дополнительные сведения об источниках контента для обхода см. в статье Планирование обхода контента и федерации в SharePoint Server.
О компоненте обработки контента
Компонент обработки контента обрабатывает обойденные элементы и отправляет их в компонент индексирования. Компонент обработки выполняет такие операции, как разбор документов и сопоставление свойств. Он также выполняет лингвистическую обработку, например определение языка и извлечение объектов. Компонент преобразует обойденные элементы в артефакты, включаемые в индекс поиска. Он также записывает сведения о ссылках и URL-адресах в базу данных ссылок.
Дополнительные сведения об обработке контента см. в статье Планирование обхода контента и федерации в SharePoint Server.
О компоненте обработки аналитических данных
Компонент обработки аналитики выполняет два вида анализа: анализ поиска и анализ использования. Этот компонент использует полученную информацию для повышения релевантности поиска, создания отчетов по поиску, а также формирования рекомендаций и прямых ссылок.
Анализ поиска позволяет извлечь такую информацию, как ссылки, число щелчков элемента, текст привязки, данные, связанные с пользователями, и метаданные, из базы данных ссылок. Эта информация важна для релевантности.
Анализ использования позволяет проанализировать сведения из журнала использования, полученные с интерфейсного веб-сервера через хранилище событий. Анализ использования создает отчеты об использовании и статистические отчеты.
Результаты анализа будут добавлены в элементы индекса поиска. Кроме того, результаты анализа использования хранятся базе данных отчетов анализа.
Дополнительные сведения см. в статье Обзор обработки аналитических данных в SharePoint Server.
О компоненте индексирования
Индекс поиска можно разделить на отдельные части, называемые "разделами индекса". Индекс поиска — это объединение всех разделов индекса. Каждый раздел содержит одну или несколько реплик индекса с одинаковой информацией. Для обеспечения отказоустойчивости и избыточности создайте дополнительные реплики индекса для каждого раздела и скопируйте реплики на несколько серверов.
Компонент индексирования — это логическое представление реплики индекса. В топологии поиска необходимо подготовить по одному компоненту индексирования для каждой реплики индекса.
Компонент индексирования:
Получает обработанные элементы из компонента обработки контента и записывает их в файл индекса. Файлы индекса хранятся на диске сервера, на котором размещен компонент индексирования.
Получает запросы из компонента обработки запросов и возвращает наборы результатов.
Дополнительные сведения о схеме и индексе поиска см. в статье Обзор схемы поиска в SharePoint Server.
О компоненте обработки запросов
Компонент обработки запросов анализирует и обрабатывает запросы и результаты. Он выполняет такие операции лингвистической обработки, как разбиение на слова и выделение корней. Получая запрос от интерфейсного веб-сервера поиска, компонент анализирует и обрабатывает его для оптимизации точности, списка возврата и релевантности. Обработанный запрос отправляется в компонент индексирования. Компонент индексирования возвращает набор результатов в компонент обработки запросов, который обрабатывает его перед отправкой на интерфейсный сервер поиска.
Дополнительные сведения см. в статье Планирование преобразования запросов и упорядочивания результатов в SharePoint Server.
О компоненте администрирования поиска
Компонент администрирования поиска запускает системные процессы для поиска. Этот компонент выполняет подготовку, то есть добавляет и инициализирует экземпляры других компонентов поиска.
О базе данных обхода
База данных обхода хранит данные отслеживания и накопленные сведения об обойденных элементах. Например, в ней хранятся сведения о времени последнего обхода, идентификаторе последнего обхода и типе обновления при последнем обходе.
О базе данных ссылок
База данных ссылок хранит сведения, извлеченные компонентом обработки контента. В ней также хранятся сведения о количестве переходов пользователей по результатам поиска. Эти данные хранятся в необработанном виде и анализируются компонентом обработки аналитических данных.
О базе данных аналитических отчетов
База данных отчетов анализа хранит результаты анализа использования. Кроме того, в ней хранятся статистические данные анализа. SharePoint Server использует эту информацию для создания отчетов Excel, показывающих различные статистические данные.
О базе данных администрирования поиска
База данных администрирования поиска хранит данные конфигурации поиска, такие как топология, правила обхода, правила запросов и сопоставления между свойствами, для которых был выполнен обход, и управляемыми свойствами. В ней также хранится список управления доступом (ACL) для компонента обхода. Для каждого приложения-службы поиска может существовать только одна база данных администрирования поиска.