Поделиться через


Обзор обработки аналитических данных в SharePoint Server

ОБЛАСТЬ ПРИМЕНЕНИЯ:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint в Microsoft 365

Чтобы помочь определить и выявить содержимое, которое пользователи считают наиболее полезным и актуальным, компонент обработки аналитики в SharePoint Server анализирует как само содержимое, так и способ взаимодействия пользователей с ним. Результаты анализа добавляются в элементы индекса поиска, чтобы со временем релевантность поиска автоматически росла. Кроме того, полученные результаты используются в отчетах для администраторов поиска, помогающих увидеть, какие действия ведут к улучшению системы поиска.

Архитектура аналитики

Архитектура аналитики состоит из трех основных частей.

  • Компонент обработки аналитических сведений выполняет задания аналитической обработки. Дополнительные сведения см. в разделе Различные типы анализов.

  • База данных аналитической отчетности хранит статистические сведения, такие как счетчики событий использования, взятые из различных анализов. SharePoint Server использует сведения в этой базе данных для создания отчетов Excel для администраторов поиска. Дополнительные сведения см. в разделах Аналитика использования и Отчеты, основанные на обработке аналитических сведений.

  • База данных ссылок хранит сведения о поисках и документах, обработанных во время обхода контента. Данные в этой базе обрабатываются различными подкомпонентами анализа. Дополнительные сведения см. в разделе Аналитика поиска.

Различные типы анализов

Компонент обработки аналитических сведений выполняет два основных типа анализа: аналитика поиска и аналитика использования. Аналитика поиска служит для анализа контента в поисковом индексе, а аналитика использования — для анализа пользовательских действий.

  • Аналитика поиска служит для анализа контента, который был добавлен в индекс поиска после обхода.

  • Аналитика использования служит для анализа действий пользователей или событий использования, таких как переходы или просмотр элементов, на сайте SharePoint Server.

Аналитика поиска

Аналитика поиска — это набор отдельных анализов, которые получают из контента такие сведения, как ссылки и текст привязки, по мере обхода и обработки контента и сохраняют полученные данные в индекс поиска. Извлеченные сведения сохраняются в базе данных ссылок вместе со сведениями о количестве щелчков результатов поиска. Сведения в базе данных ссылок далее обрабатываются в различных подкомпонентах анализа.

Сведения, полученные в результате аналитики поиска, используются для улучшения индекса поиска благодаря данным, которые могут повысить релевантность и быстроту вывода результатов, и сохраняются в базе данных отчетности для последующего включения в отчеты.

Анализы в аналитике поиска

Анализ Описание
Обработка текста привязки Обработка текстов привязок служит для анализа взаимосвязи элементов контента. Кроме того, сюда включаются тексты привязок, связанные со ссылками в анализе. Компонент обработки аналитических сведений использует результаты этого анализа для добавления баллов рейтинга к элементам в индексе поиска.
Количество переходов Анализ количества переходов вычисляет количество щелчков между достоверной страницей и элементами в индексе поиска. Авторитетной страницей может быть сайт верхнего уровня, например , https://www.contoso.comили другие страницы, которые считаются важными. Вы можете определить полномочные страницы в центре администрирования.

Компонент обработки аналитических сведений использует результаты этого анализа для ранжирования элементов в индексе поиска.
Переходы в поиске Анализ переходов в результатах поиска задействует сведения о том, какие элементы щелкали пользователи в результатах поиска, чтобы просмотреть элементы в индексе поиска. Этот анализ вычисляет новое ранжирование элементов относительно базовой релевантности.

Данные о переходах сохраняются в базе данных ссылок.
Социальные теги Анализ социальных тегов работает со словами или фразами, которые пользователи могут применять к контенту для распределения контента по понятным категориям.

В SharePoint Server теги социальных параметров не используются для уточнения, ранжирования или отзыва по умолчанию. Однако можно создать пользовательские условия поиска, в которых используются социальные теги и сведения из этого анализа.
Социальная дистанция При анализе социальной дистанции вычисляются отношения между пользователями, использующими функцию подписки. Анализ вычисляет первый и второй уровни подписок: сначала первый уровень подписки, затем подписку на первого подписчика.

Эти сведения используются для упорядочивания результатов поиска людей по социальной дистанции.
Отчеты о поиске Анализ отчетов о поиске сводит воедино данные и сохраняет эти данные в базе данных аналитической отчетности, где они используются для создания следующих отчетов поиска:

Количество запросов

Самые популярные запросы

Прерванные запросы

Безрезультатные запросы

Использование правил запросов

Данные отчетов сохраняются в приложении-службе поиска, а не в элементах индекса поиска. Если удалить приложение-службу поиска, данные отчетов также будут удалены.
Прямые ссылки В анализе прямых ссылок используются сведения о том, что пользователи фактически выбирали в результатах поиска для определения самых важных вложенных страниц на сайте. Эти страницы отображаются в результатах поиска как важные ссылки на сайте, а пользователи могут получать доступ к релевантным вложенным страницам напрямую в результатах поиска.

Анализ использования

Аналитика использования — это набор анализов, которые получают сведения о действиях пользователя или событиях использования, таких как щелчки или просмотрированные элементы, на сайте SharePoint Server. Аналитика использования объединяет эти сведения с данными из анализов поиска по обойденному контенту, а затем обрабатывает эти данные. Сведения о рекомендациях и событиях использования добавляются в индекс поиска. Статистика по различным событиям использования добавляется в индекс поиска и отправляется в базу данных отчетов Аналитики.

Набор событий использования по умолчанию определяется по умолчанию. События по умолчанию всегда регистрируются и анализируются SharePoint Server. Вы также можете настроить пользовательские типы событий. Дополнительные сведения о событиях использования по умолчанию см. в статье События использования, обрабатываемые аналитикой использования.

Анализы в аналитике использования

Анализ Описание
Счетчики использования Анализ счетчиков использования служит для анализа таких событий, как просмотр и переход по элементам. Анализ вычисляет, сколько раз элемент открывается в целом не только со страницы результатов поиска, но и, например, при открытии документа в Word или щелчке в библиотеке SharePoint Server.

Анализ вычисляет как недавние события, так и все связанные события для всех определенных типов событий. По умолчанию для последних событий задано значение последних 14 дней, но вы можете задать его в диапазоне от 1 до 14 дней (локально). Статистические данные объединяются на уровне сайта, семейства веб-сайтов и уровня организации (SharePoint в Microsoft 365).

События использования сохраняются временно на интерфейсном веб-сервере и передаются в приложение-службу поиска каждые 15 минут. События использования хранятся на диске 14 дней до удаления. Ежедневно анализируются данные по счетчикам использования за весь прошедший день.

Счетчики использования добавляются к элементам в индексе поиска для повышения релевантности поиска. Сведения также сохраняются в базе данных аналитической отчетности и могут использоваться для отображения популярных элементов на сайте.
Рекомендации Анализ рекомендаций создает рекомендации между элементами на основе взаимодействия пользователей с элементами на сайте. В анализе используются те же события, что и при анализе счетчиков использования, однако оцениваются другие схемы использования. Анализ вычисляет отношения между элементами и добавляет эти сведения к элементам в индексе поиска.

Эти данные могут использоваться для отображения рекомендаций на сайте, например «Вместе с этим также смотрят».

Данные сохраняются в базе данных аналитической отчетности в целях восстановления. Отчеты, связанные с рекомендациями, основаны на анализе счетчиков использования.
Ранжирование активности Анализ ранжирования активности задействует отслеживание активности по событиям использования (частота событий), что влияет на релевантность поиска. Элементы с высокой степенью активности использования (переходы и просмотры), как правило, получают более высокий ранг активности по сравнению с менее популярными элементами.

Анализ определяет тенденции в активности элементов. Если подсчитать только количество событий, старые элементы обычно "выигрывают" в релевантности, так как у старых документов было больше времени для сбора действий. Отслеживание активности позволяет присваивать высокий ранг более новым документам с высокой степенью активности.

События использования, которые применяются в аналитике использования

SharePoint Server включает следующие события использования по умолчанию:

  • Представления

  • Отображение рекомендаций

  • Переходы по рекомендациям

Кроме событий по умолчанию можно добавить до двенадцати настраиваемых событий. Например, можно добавить настраиваемое событие, которое отслеживает частоту открытия элемента с мобильной платформы.

Все события использования учитываются для каждого элемента, семейства веб-сайтов и клиента (SharePoint в Microsoft 365).

Отчеты на основе обработки аналитических сведений

Компонент обработки аналитических данных создает данные, используемые для создания следующих отчетов по использованию:

  • Тренды популярности. Отчет Excel, в котором отображается ежедневное и ежемесячное количество событий использования для семейства веб-сайтов, сайта или определенного элемента в библиотеке или списке SharePoint.

    Примечание.

    Уникальные пользователи отображают количество уникальных пользователей в день, а уникальные пользователив месяц — СУММ(UU/День) за месяц.

  • Самые популярные элементы Показывает ранжирование по событию использования для всех элементов в библиотеке или списке, например наиболее просматриваемых элементов в библиотеке или списке. Ранги можно сортировать по недавним событиям или событиям за все время.

Защита конфиденциальности данных, собранных компонентом обработки аналитических сведений

Компонент обработки аналитики собирает те части данных, которые связаны с персональными данными. SharePoint Server имеет различные функции для защиты конфиденциальности этой информации.

Для каждого события использования компонент обработки аналитических сведений заносит в журнал следующие сведения:

  • URL-адрес элемента, для которого произошло событие использования;

  • свойства SiteID, WebID и TenantID расположения, в котором произошло событие использования;

  • время и дата события использования;

  • замаскированный идентификатор пользователя, вызвавшего событие использования.

Эти данные хранятся в приложении-службе поиска, пока не будут обработаны компонентом обработки аналитических сведений. Данные автоматически удаляются через 30 дней. Результаты обработки данных представлены в приведенном ниже списке.

  • Общее количество событий использования.

  • Общее количество уникальных событий использования.

  • Рекомендации для каждого элемента.

  • Возможности, связанные с релевантностью.

Эти результаты хранятся в базе данных аналитических отчетов и в индексе поиска. В результате обработки данных не сохраняется никаких сведений о пользователях. Замаскированный идентификатор пользователя применяется только при подсчете количества уникальных событий использования и рекомендаций для каждого элемента.

Результаты можно просмотреть в двух отчетах об использовании. Дополнительные сведения см. в статье Просмотр отчетов об использовании в SharePoint Server.

Файлы cookie использования для сайтов с анонимными пользователями

По умолчанию файлы cookie использования не включены для веб-приложения SharePoint Server. Для создания уникальных подсчетов пользователей и рекомендаций по обмену элементами для сайтов с анонимными пользователями SharePoint Server позволяет использовать файлы cookie использования для веб-приложения SharePoint. При включении файлов cookie использования создается уникальный идентификатор GUID, который используется в качестве идентификатора пользователя при обработке данных. Идентификатор GUID доступен на время существования файла cookie и используется в качестве идентификатора пользователя при обработке данных. Время существования файла cookie составляет 14 дней.

Важно!

Локальные юридические ограничения могут применяться, если вы включили файлы cookie на сайтах с анонимными пользователями.

Сведения о включении файлов cookie использования для веб-приложения SharePoint см. в статье Изменение общих параметров веб-приложения в SharePoint Server. Эта статья также относится к SharePoint Server 2016.