Поделиться через


Об источниках контента (Search Server 2008)

Обновлено: 2009-04-28

Note Примечание:

Если не указано иное, содержащаяся в данной статье информация относится как к серверу Microsoft Search Server 2008, так и к серверу Microsoft Search Server 2008 Express.

Контентом называется любой элемент, для которого поддерживается обход, например веб-страница, документ Microsoft Office Word, бизнес-данные или сообщение электронной почты. Контент размещается в репозитории, например на веб-сайте, в общей папке или на сайте SharePoint. Источник контента задает параметры, определяющие порядок и расписание обхода контента. Источник содержит один или несколько адресов репозитория контента, с которых следует начинать обход. Такие адреса также называются начальными адресами. Эти параметры применяются ко всем начальным адресам в пределах источника контента.

Источник контента по умолчанию

Если в организации нужно выполнять обход только контента, находящегося на сайтах SharePoint, в создании дополнительных источников контента может не возникнуть необходимости. Search Server 2008 определяет источник контента по умолчанию в ходе начального развертывания. Источник контента по умолчанию называется Local Office SharePoint Server sites (локальные сайты Office SharePoint Server). В состав источника контента по умолчанию автоматически включаются начальные адреса всех веб-приложений на ферме серверов. По умолчанию обход этого источника контента не выполняется. Для индексирования контента из источника по умолчанию нужно вручную запустить или запланировать обход.

Создание нового источника контента

При создании источника контента указываются параметры, которые определяют тип обходимого контента, время обхода контента и правила обхода, например глубину обхода в пространстве имен начального адреса или допустимое число переходов. Если имеется несколько типов репозиториев контента для обхода или обход некоторых репозиториев нужно выполнять по особому расписанию, необходимо создать дополнительные источники контента. В Поисковый сервер входит один поставщик общих служб, который поддерживает до 500 источников контента. Дополнительные сведения см. в разделе "Планирование источника контента" статьи Планирование обхода содержимого (Search Server 2008). Дополнительные сведения о настройке режима обхода см. в разделе Ограничение или увеличение объема содержимого для обхода (Search Server 2008).

Типы репозиториев контента

Источник контента обеспечивает обход только одного источника контента. Это значит, что можно создать один источник контента, включающий URL-адреса сайтов SharePoint, и другой источник контента с URL-адресами общих папок, но нельзя создать источник, включающий URL-адреса и сайтов SharePoint, и общих папок.

В следующей таблице перечислены типы контента, обход и индексирование которых поддерживается в Поисковый сервер.

Тип источника контента Содержащийся тип контента

Сайты SharePoint

  • Сайты SharePoint с одной или нескольких ферм Microsoft Office SharePoint Server 2007, Windows SharePoint Services 3.0 или Search Server 2008.

  • Сайты SharePoint из фермы Microsoft Office SharePoint Portal Server 2003 или Microsoft Windows SharePoint Services 2.0

    NoteПримечание:
    Программа-обходчик Search Server 2008 может автоматически обходить все сайты и дочерние сайты Office SharePoint Server 2007, Windows SharePoint Services 3.0 и Search Server 2008. Программа-обходчик может выполнять обход продуктов и технологий SharePoint предыдущих версий, однако необходимо указывать URL-адрес каждого сайта верхнего уровня (семейства сайтов) и каждого дочернего сайта для обхода. Сайты, перечисленные в каталоге сайтов ферм Microsoft Office SharePoint Portal Server 2003, обходятся при обходе сайта портала. Дополнительные сведения о каталоге сайтов см. в разделе About the Site Directory (на английском языке) (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x419) (на английском языке).

Веб-сайты

  • Веб-контент в пределах организации, расположенный вне сайтов SharePoint.

  • Содержимое на веб-сайтах в Интернете.

    NoteПримечание:
    При использовании типов контента веб-сайтов или сайтов SharePoint программа-обходчик действует одинаково. Отличаются только параметры обхода контента, которые можно выбрать для данных типов источников.

Общие файловые ресурсы

  • Содержимое, находящееся в общих папках в пределах организации.

Общие папки Exchange

  • Содержимое Microsoft Exchange Server

Lotus Notes

  • Контент, хранящийся в базах данных Lotus Notes.

    NoteПримечание:
    Источник контента Lotus Notes не выводится в пользовательском интерфейсе, пока сервер индексирования не настроен для работы с Lotus Notes. Дополнительные сведения см. в разделе Подготовка к обходу Lotus Notes (Search Server 2008).

Начальный адрес контента

В каждом источнике контента ведется список начальных адресов, которые используются программой-обходчиком для подключения к репозиторию контента. Каждый источник контента может содержать до 500 начальных адресов. Нельзя обходить один адрес, используя несколько источников контента. Например, если тот или иной источник контента используется для обхода семейства сайтов и всех дочерних сайтов, нельзя использовать другой источник контента для обхода этих дочерних сайтов по другому расписанию.

Обход контента

Для источника контента можно запустить обход вручную или запланировать время и частоту обхода выбранного источника контента. Если часть контента в источнике нужно обходить по отдельному расписанию, необходимо создать для этого контента отдельный источник. По соображениям производительности и удобства управления рекомендуется использовать минимально необходимое число источников контента. Дополнительные сведения о запуске обхода вручную и по расписанию см. в разделе Обход содержимого (Search Server 2008).

Проверка подлинности

Когда программа-обходчик обращается к начальным адресам, перечисленным в источниках контента, его подлинность должна быть проверена для предоставления доступа к серверам, на которых размещен контент. Учетная запись пользователя, используемая программой-обходчиком для обхода контента, должна обладать как минимум разрешениями на чтение. По умолчанию Поисковый сервер использует учетную запись для доступа к контенту по умолчанию и протокол NTLM для проверки подлинности на серверах. Дополнительные сведения см. в разделе Настройка метода проверки подлинности обходчика (Search Server 2008).

См. также

Понятия

Планирование обхода содержимого (Search Server 2008)
Настройка поиска на включения записей блогов в результаты (Search Server 2008)
Настройка клиентских сертификатов для обхода сайтов SSL (Search Server 2008)
Настройка свойств веб-частей (Search Server 2008)