Поделиться через


Рекомендации по использованию журналов обхода контента (SharePoint Server 2010)

 

Применимо к: SharePoint Server 2010

Последнее изменение раздела: 2015-03-09

Журнал обхода контента отслеживает данные о состоянии контента, для которого выполнен обход. Этот журнал позволяет узнать, был ли контент после обхода успешно индексирован, какой контент был исключен на основании правила обхода; кроме того, из него можно узнать о сбое индексирования в случае ошибки. Журнал обхода также содержит дополнительные сведения о контенте, который просматривается во время обхода, в том числе о времени последнего успешного обхода, источниках контента и применении правил обхода. С помощью журнала обхода можно диагностировать проблемы с функциями поиска.

Содержание:

  • Просмотр журнала обхода

  • Представления журнала обхода

  • Задание таймера журнала обхода

  • Устранение распространенных неполадок

Просмотр журнала обхода

  1. Убедитесь, что учетной записи пользователя, выполняющего эту процедуру, назначены права администратора на приложение-службу поиска.

  2. В центре администрирования на панели быстрого запуска выберите Управление приложениями.

  3. На странице управления приложениями в разделе Приложения-службы щелкните Управление приложениями-службами.

  4. На странице "Приложения-службы" в списке приложений служб выберите нужное приложение-службу.

  5. На странице "Администрирование поиска" в панели быстрого запуска в разделе Обход контента выберите Журнал обхода контента.

  6. На странице "Журнал обхода контента — источник контента" выберите нужное представление.

Представления журнала обхода

В следующей таблице описываются различные представления, в которых можно просматривать состояние контента, для которого выполнен обход.

Представление Описание

Источник контента

Элементы обхода сгруппированы по источнику контента. Здесь отображаются данные об успешных операциях, предупреждения, ошибки, ошибки верхнего уровня и данные об удалении. В этом представлении показано текущее состояние элементов, уже добавленных в индекс для каждого источника контента. Данные для этого представления поступают из объектной модели.

Имя узла

Элементы обхода сгруппированы по узлу. Здесь отображаются данные об успешном завершении, предупреждения, ошибки, данные об удалении, ошибки верхнего уровня и общее количество. В этом представлении показано текущее состояние элементов, уже добавленных в индекс для каждого узла. Если в среде организации существует несколько баз данных обхода, данные сгруппированы по базам данных обхода. Данные для этого представления поступают из базы данных администрирования поиска. Можно фильтровать результаты; для этого введите URL-адрес в поле Найти URL-адреса, начинающиеся со следующего пути или доменного имени:.

URL-адрес

Здесь можно выполнять поиск в журналах обхода по источнику контента, URL-адресу или имени узла и просматривать подробные сведения обо всех элементах в индексе. Данные для этого представления поступают из таблицы MSSCrawlURLReport table базы данных обхода. Можно фильтровать результаты; для этого определите параметры Состояние, Сообщение:, Время начала и Время окончания.

Журнал обхода контента

Здесь отображаются сводные данные о транзакциях обхода, выполненных во время обхода. Во время обхода для одного элемента может быть выполнено несколько транзакций обхода, поэтому количество транзакций может превышать общее количество элементов. В этом представлении показаны данные для трех типов обходов.

  • Полный. Обход выполняется для всех элементов в источнике контента.

  • Добавочный. Обход выполняется для элементов, которые были изменены с момента последнего полного или добавочного обхода. Обход этого типа выполняется, только если он запланирован.

  • Удаление. Если начальные адреса удалены из источника контента, то перед выполнением полного или добавочного обхода запускается обход удаления, при котором из индекса удаляются элементы, связанные с этими удаленными начальными адресами. Обход этого типа нельзя запланировать.

Данные для этого представления поступают из базы данных администрирования поиска. Можно фильтровать результаты по источнику контента.

Сообщение об ошибке

Здесь представлены агрегированные данные об ошибках для каждого источника контента или имени узла. Данные для этого представления поступают из таблицы MSSCrawlURLReport table базы данных обхода. Можно применять фильтрацию по источнику контента или узлу.

Примечание

В раскрывающемся списке параметров фильтра отображаются только источники контента с ошибками. Если ошибка связана с элементом, отсутствующим в индексе, такая ошибка не отображается в этом представлении.

В представлениях "Источник контента", "Имя узла" и "Журнал обхода контента" данные содержатся в следующих столбцах.

  • Успешные операции. Элементы, для которых обход был выполнен успешно и которые доступны для поиска.

  • Предупреждения. Элементы, для которых обход, возможно, не был выполнен успешно и которые могут быть недоступны для поиска.

  • Ошибки. Элементы, для которых обход не был выполнен успешно и которые могут быть недоступны для поиска.

  • Удаления. Элементы, которые были удалены из индекса и которые больше недоступны для поиска.

  • Ошибки верхнего уровня. Ошибки в документах верхнего уровня, включая начальные адреса, виртуальные серверы и базы данных контента. Все ошибки верхнего уровня считаются ошибками, но не все ошибки считаются ошибками верхнего уровня. Поскольку в столбце Ошибки отображается количество, включающее в себя количество из столбца Ошибки верхнего уровня, в представлении "Имя узла" ошибки верхнего уровня не пересчитываются.

  • Не изменено. Элементы, которые не изменялись между обходами.

  • Обновление системы безопасности. Элементы, для которых был выполнен обход параметров безопасности, поскольку они были изменены.

Задание таймера журнала обхода

По умолчанию данные в каждом представлении журнала обхода обновляются через каждые пять минут с помощью задания таймера "Отчет по журналу обхода контента для приложения поиска <имя приложения-службы поиска>. Можно изменить частоту обновления в этом задании таймера, но рекомендуется оставить значение по умолчанию.

Совет

Если данные в журнале обхода кажутся неактуальными, убедитесь, что задание таймера не было приостановлено и недавно выполнялось.

Проверка состояния задания таймера журнала обхода

  1. Убедитесь, что учетная запись пользователя, с помощью которой выполняется данная процедура, является членом группы администраторов фермы SharePoint.

  2. В центре администрирования в разделе Мониторинг щелкните Проверка состояния заданий.

  3. На странице "Состояние задания таймера" щелкните Журнал заданий.

  4. На странице "Журнал заданий" найдите задание "Отчет по журналу обхода контента для приложения поиска <имя приложения-службы поиска>" для приложения-службы поиска, состояние которого требуется проверить.

Изменение частоты обновления задания таймера журнала обхода

  1. Убедитесь, что учетная запись пользователя, с помощью которой выполняется данная процедура, является членом группы администраторов фермы SharePoint.

  2. В центре администрирования в разделе Мониторинг щелкните Проверка состояния заданий.

  3. На странице "Состояние задания таймера" щелкните Журнал заданий.

  4. На странице "Журнал заданий" выберите задание Отчет по журналу обхода контента для приложения поиска <имя приложения-службы поиска> для необходимого приложения-службы поиска.

  5. На странице "Изменение задания таймера" в разделе Регулярное расписание измените расписание задания таймера, указав необходимый интервал.

  6. Нажмите кнопку ОК.

Устранение распространенных неполадок

В этом разделе представлены сведения о распространенных ошибках в журнале обхода, о поведении обходчика и о действиях, позволяющих поддерживать среду обхода в исправном состоянии.

Ошибка при удалении элемента из индекса

Если обходчику не удается найти существующий в индексе элемент, поскольку его URL-адрес устарел или стал недоступным из-за временного отсутствия подключения к сети, то во время обхода для этого элемента выдается сообщение об ошибке. Если это повторяется во время трех последующих обходов, элемент удаляется из индекса. Для источников контента общих файловых ресурсов элементы удаляются из индекса сразу после их удаления из общего файлового ресурса.

Ошибка типа "Объект не найден", связанная с общим файловым ресурсом

Эта ошибка может возникнуть в том случае, если во время обхода обнаружено, что источник контента общего файлового ресурса содержит действительное имя узла, но недействительное имя файла. Например, если существует имя узла и имя файла \\ValidHost\files\file1, но узел \\ValidHost найден, а файл file1 — нет. При этом обходчик выдает сообщение об ошибке "Объект не найден" и удаляет элемент из индекса. В представлении "Журнал обхода контента" отображаются следующие сведения:

  • Ошибка: 1

  • Удаления: 1

  • Ошибки верхнего уровня: 1 (\\ValidHost\files\file1 отображается как ошибка верхнего уровня, поскольку это начальный адрес)

В представлении "Источник контента" отображаются следующие сведения:

  • Ошибки: 0

  • Удаления: 0

  • Ошибки верхнего уровня: 0

В представлении "Источник контента" отображаются нулевые значения, поскольку это представление показывает состояние только для элементов, содержащихся в индексе, а данный начальный адрес не был добавлен в индекс. Однако в представлении "Журнал обхода контента" отображаются все транзакции обхода, даже для элементов, не добавленных в индекс.

Ошибка типа "Не удалось разрешить сетевой путь для элемента", связанная с общим файловым ресурсом

Эта ошибка может возникнуть в том случае, если во время обхода обнаружено, что источник контента общей папки содержит недействительное имя узла и недействительное имя файла. Например, если существует имя узла и имя файла \\InvalidHost\files\file1, но узел \\InvalidHost и файл file1 не существуют. При этом обходчик выдает сообщение об ошибке "Не удалось разрешить сетевой путь для элемента" и не удаляет элемент из индекса. В представлении "Журнал обхода контента" отображаются следующие сведения:

  • Ошибки: 1

  • Удаления: 0

  • Ошибки верхнего уровня: 1 (\\InvalidHost\files\file1 отображается как ошибка верхнего уровня, поскольку это начальный адрес)

В представлении "Источник контента" отображаются следующие сведения:

  • Ошибка: 0

  • Удаления: 0

  • Ошибки верхнего уровня: 0

Элемент не удаляется из индекса, поскольку обходчик не может определить, действительно ли элемент не существует или доступ к элементу невозможно получить из-за временного отключения от сети.

Устаревшие начальные адреса

В журнале обхода могут содержаться сообщения об ошибках верхнего уровня, связанные с документами верхнего уровня или начальными адресами. Чтобы обеспечить исправность источников контента, необходимо принимать следующие меры.

  • Всегда выяснять причину ошибок верхнего уровня, если их количество больше нуля.

  • Всегда выяснять причину ошибок верхнего уровня, если они постоянно отображаются в журнале обхода.

  • Если это невозможно, рекомендуется удалять устаревшие начальные адреса через каждые две недели, предварительно связавшись с владельцем сайта.

Устранение неполадок и удаление устаревших начальных адресов

  1. Убедитесь, что учетной записи пользователя, выполняющего эту процедуру, назначены права администратора на приложение-службу поиска.

  2. При получении сведений о том, что начальный адрес может быть устаревшим, сначала проверьте, существует ли он, отправив на сайт команду ping. В случае получения ответа, определите, какая из следующих проблем привела к отображению ошибки.

    • Если доступ к URL-адресу можно получить из браузера, это означает, что обходчику не удалось выполнить обход начального адреса из-за проблем с сетевым соединением.

    • Если в браузере выполняется перенаправление на другой URL-адрес, необходимо заменить начальный адрес на этот новый адрес.

    • Если в браузере при открытии URL-адреса отображается ошибка, повторите попытку в другое время. Если ошибка возникает повторно после нескольких попыток, свяжитесь с владельцем сайта и выясните, работает ли сайт.

  3. Если после отправки на сайт команды ping ответ не получен, этот сайт не существует, и его следует удалить. Прежде чем удалять сайт, получите подтверждение от владельца сайта.

Доступ запрещен

Если в журнале обхода постоянно возникают ошибки типа "Доступ запрещен" для определенного начального адреса, вероятно, учетная запись для доступа к контенту не имеет разрешений на чтение для обхода сайта. Если можно просмотреть URL-адрес с помощью учетной записи администратора, это может указывать на проблемы с обновлением разрешений. В этом случае необходимо запросить разрешения у владельца сайта. Дополнительные сведения о настройке разрешений для обходчика см. в статье Manage crawl rules (SharePoint Server 2010).

Нулевые значения в представлении "Источник контента" во время распределения узлов

Во время распределения узлов во всех столбцах представления "Источник контента" отображаются нулевые значения. Причина состоит в том, что все значения в представлении "Источник контента" берутся непосредственно из таблиц базы данных обхода. Во время распределения узлов данные из этих таблиц перемещаются, поэтому в течение всего процесса распределения узлов сохраняются нулевые значения.

После распределения узлов выполните добавочный обход источников контента, чтобы восстановить исходные значения.

Отображение удалений из общих файловых ресурсов в представлении "Источник контента"

При удалении документов из источника контента общей папки, для которого обход был выполнен успешно, эти документы немедленно удаляются из индекса во время следующего полного или добавочного обхода. В представлении "Источник контента" журнала обхода для этих элементов будут отображены ошибки, но в других представлениях они будут показаны как удаленные.

В случае остановки или перезапуска службы поиска SharePoint Server в журнале обхода возникает расхождение

Иногда служба поиска SharePoint Server (OSearch14) сбрасывается или перезапускается в зависимости от выполняемых операций администрирования или серверных функций. Когда это происходит, в представлении "Журнал обхода контента" журнала обхода может возникнуть расхождение. Количество сообщений о транзакциях может отличаться от количества транзакций, фактически выполненных для каждого обхода. Причина состоит в том, что служба OSearch14 хранит активные транзакции в памяти и записывает их после их завершения. В случае остановки, сброса или перезапуска службы OSearch14 до записи транзакций из памяти в базу данных журнала обхода количество транзакций в каждом обходе будет отображаться неправильно.