Поделиться через


Фильтры IFilter и обработчики протокола (Search Server 2008)

Обновлено: 2009-04-16

NoteПримечание:

Если не указано иное, содержащаяся в данной статье информация относится как к серверу Microsoft Search Server 2008, так и к серверу Microsoft Search Server 2008 Express.

Программа-обходчик в Search Server 2008 использует обработчики протокола для доступа к контенту и фильтры IFilter для извлечения контента из обходимых файлов. Фильтры IFilter удаляют форматирование, относящееся к приложению, а затем механизм индексирования индексирует контент документа. В Поисковый сервер обход выполняется только для типов файлов, для которых установлены обработчики протокола и фильтры IFilter.

В этом разделе описываются фильтры IFilter и обработчики протокола, которые по умолчанию устанавливаются вместе с Поисковый сервер, и описывается процесс установки и регистрации дополнительных фильтров IFilter и обработчиков протокола.

Программа-обходчик использует обработчики протокола и фильтры IFilter следующим образом.

  1. Программа-обходчик получает начальные адреса источников контента и вызывает обработчик протокола в зависимости от префикса URL-адреса.

  2. Обработчик протокола подключается к источнику контента и извлекает метаданные системного уровня и данные списков управления доступом.

  3. Обработчик протокола определяет тип файла каждого элемента контента в зависимости от расширения имени файла и вызывает фильтр IFilter, связанный с этим типом файла.

  4. Фильтр IFilter извлекает контент, удаляя форматирование, а затем получает метаданные элемента контента.

  5. Контент проходит синтаксический анализ в одном или нескольких средствах разбиения текста на слова, в зависимости от языка, и добавляется в полнотекстовый индекс, который также называется индексом контента. Метаданные и списки управления доступом добавляются в базу данных поиска.

Содержание:

См. также

Добавление источников контента (Search Server 2008)