SharePoint Server 中的分析处理概述

 

**上一次修改主题:**2017-07-24

**摘要:**了解分析处理组件如何分析内容和用户操作以提高搜索相关性。

要帮助确定和显示用户认为最有用和最相关的内容,SharePoint Server 中的“分析处理组件”可自己分析这两种内容,还会分析用户与其进行交互的方法。分析结果将添加到搜索索引中的项目,以便搜索相关性随着时间自动提高。此外,报告中使用的这些结果将用于帮助搜索管理员查看可以采取哪些手动步骤改进搜索系统。

本文内容:

  • 分析体系结构

  • 不同类型的分析

  • 使用率分析使用的默认使用率事件

  • 基于分析处理进行报告

分析体系结构

分析体系结构包含以下主要部分:

  • 分析处理组件可运行分析作业。有关详细信息,请参阅不同类型的分析。

  • 分析报告数据库存储不同分析中的统计信息,例如使用率事件数。SharePoint Server 使用此数据库中的信息为搜索管理员创建 Excel 报告。有关详细信息,请参阅使用率分析和基于分析处理的报告。

  • 链接数据库存储有关搜索和已爬网文档的信息。此数据库中的数据通过不同的子分析进行处理。有关详细信息,请参阅搜索分析。

不同类型的分析

分析处理组件运行两种主要类型的分析:“搜索分析”和“使用率分析”。搜索分析分析搜索索引中的内容,而使用率分析分析用户操作。

  • “搜索分析”分析要进行爬网并添加到搜索索引的内容。

  • “使用情况分析”分析 SharePoint Server 网站上的用户操作或使用事件(如点击量或已查看项目)。

搜索分析

搜索分析是从内容中提取链接和定位文本等信息的一系列分析。就像正在对其进行爬网和处理并存储在搜索索引中一样。已提取信息与有关搜索结果点击量的信息一起存储在链接数据库中。链接数据库中的信息将在一些子分析中进行进一步处理。

搜索分析生成的信息用于丰富搜索索引中的项目,这些信息可帮助提高相关性和改进检索,并存储在报告数据库中且包含在报告中。

搜索分析中的分析

分析 说明

定位文本处理

定位文本处理分析内容集中项目的互连方式。它还包括与分析中的链接关联的定位文本。分析处理组件使用分析结果向搜索索引中的项目添加排名分数。

单击距离

单击距离分析计算权威页面和搜索索引中的项目之间的点击量。权威页面可以是首要网站(例如 https://www.contoso.com)或者视为一样重要的其他页面。可以在管理中心中定义权威页面。

分析处理组件使用分析结果向搜索索引中的项目添加排名分数。

搜索单击

搜索单击分析使用有关用户在搜索结果中单击哪些项目以升级或降级搜索索引中的项目的信息。分析计算与基本相关性相比的新的项目排名。

单击数据存储在链接数据库中。

社会性标签

社会性标签分析可分析社会性标签,这些标签是用户可对内容应用以按对其有意义的方式分类信息的词或短语。

在 SharePoint Server 中,默认情况下社会性标签不用于精简、排名或检索。但是,可以创建使用社会性标签和此分析中的信息的自定义搜索体验。

社会距离

社会距离分析计算使用追踪人员功能的用户之间的关系。该分析计算第一级和第二级追踪:首先是第一级追踪,然后是后续追踪。

该信息用于按社会距离对人员搜索结果进行排序。

搜索报告

搜索报告分析可汇总数据并将数据存储在其用于生成这些搜索报告的分析报告数据库中:

  • 查询数

  • 热门查询

  • 弃用的查询

  • 无结果查询

  • 查询规则使用情况

报告信息保存在搜索服务应用程序中,且不包含搜索索引中的项目。如果删除搜索服务应用程序,还将删除报告信息。

深度链接

深度链接分析使用有关哪些人员会实际单击搜索结果以计算网站上最重要的子页面的信息。这些页面将作为网站重要的快捷方式显示在搜索结果中,且用户可以直接从搜索结果中访问相关的子页面。

使用率分析

使用情况分析是在 SharePoint Server 网站上接收有关用户操作或使用事件(如点击量或已查看项目)的一系列分析。使用情况分析将此信息与有关搜索分析中已爬网内容的信息结合在一起,并处理这些信息。有关建议和使用事件的信息将添加到搜索索引。不同使用事件上的统计信息将添加到搜索索引并发送到分析报告数据库。

默认的使用事件组是自动定义的。默认事件始终由 SharePoint Server 注册和分析。还可以配置自定义事件类型。有关默认使用事件的详细信息,请参阅使用情况分析所使用的使用事件。

使用率分析中的分析

分析 说明

使用计数

使用计数分析可分析诸如已查看或点击的项目的事件。该分析计算某个项目总共 打开的次数,不只是从搜索结果页中打开,还包括从 Word 中打开文档或单击 SharePoint Server 库时。

该分析计算所有已定义事件类型的最近事件和全部时间的事件。默认情况下,最近事件设置为最近 14 天,但是可以将其设置在 1 和 14 天之间(本地)。统计信息数据在网站级别、网站集级别和租户级别 (SPO) 汇总。

使用率事件临时存储在 Web 前端且每 15 分钟推送到 Search Service 应用程序一次。使用率事件被删除之前在磁盘上最多保留 14 天。每天将分析之前全天的使用计数数据。

使用计数将添加到搜索索引中的项目以提高搜索相关性。该信息同样存储在分析报告数据库中,且可用于显示网站上的热门项目。

建议

建议分析可基于用户与网站上的项目交互的方式在项目之间创建建议。该分析使用与使用计数相同的事件文件,但查找使用情况的模式。该分析计算项目到项目的关系图并将信息添加到搜索索引中的项目。

该信息可用于在网站上显示建议,例如“同样可以查看已查看此信息的人”。

数据存储在分析报告数据库中以便进行恢复。与建议相关的报告以使用计数分析为基础。

活动排名

活动排名分析使用使用率事件(事件率)的活动排名影响搜索相关性。具有高使用率活动(点击或查看)的项目通常会取得较不太热门的项目更高的活动排名分数。

该分析查找项目活动中的趋势。如果只对事件数进行计数,较旧的项目通常将在相关性方面“取胜”,因为较旧的文档具有更多时间可收集活动。活动排名可帮助具有高使用率活动的较新的文档取得更高排名。

使用率分析所使用的使用率事件

SharePoint Server 包括以下默认使用事件:

  • 浏览量

  • 显示的建议

  • 点击的建议

除了默认事件之外,可以添加多达 12 个自定义事件。例如,可以添加跟踪从移动平台中访问某个项目的频率的自定义事件。

所有使用率事件将针对每个项目、网站集和租户 (SPO) 进行计数。

基于分析处理的报告

分析处理组件生成用于创建以下使用率报告 的数据:

  • 热门程度趋势 显示 SharePoint 库或列表中网站集、网站或特定项目每个使用率事件的每日和每月计数的 Excel 报告。

    备注

    “唯一用户数”显示每日的唯一用户的数量,而每月“唯一用户数”显示一个月的 SUM(UU/Day)

  • 最受欢迎的项目 显示库或列表中所有项目的每个使用率事件的排名,例如库或列表中查看最多的项目。排名可以按“最近”或“曾经”排序。

分析处理组件收集的数据的隐私保护

分析处理组件收集的数据的部件与个人身份信息相关。SharePoint Server 具有不同的功能来保护此信息的隐私。

对于每个使用率事件,分析处理组件将记录以下信息:

  • 发生使用率事件的项目的 URL。

  • 发生使用率事件的 SiteID、WebID 和 TenantID。

  • 使用率事件发生的时间和日期。

  • 导致使用率事件发生的用户的经过模糊处理的用户 ID。

此数据在分析处理组件处理之前存储在 Search Service 应用程序中。此数据在 30 天后将自动删除。以下列表显示了数据处理的结果:

  • 使用率事件的总数。

  • 唯一使用率事件的总数。

  • 项目到项目的建议。

  • 相关性功能。

这些结果存储在分析报告数据库和搜索索引中。不会存储数据处理产生的用户信息。经过模糊处理的用户 ID 仅在计算唯一使用率事件计数和计算项目到项目建议时使用。

您可以在两个使用率报告中查看结果。有关详细信息,请参阅在 SharePoint 服务器中查看使用率报告

默认情况下,SharePoint Server Web 应用程序未启用使用 Cookie。要为具有匿名用户的网站生成唯一用户计数和项目到项目建议,SharePoint Server 允许为 SharePoint Web 应用程序启用使用 Cookie。启用使用 Cookie 后,这将生成在处理数据时用作用户 ID 的唯一 GUID。GUID 可用于 Cookie 的生存期,且在处理数据时用作用户 ID。Cookie 的生存期为 14 天。

重要

如果您在具有匿名用户的网站上启用 Cookie,则本地法律限制可能适用。

要为 SharePoint Web 应用程序启用使用 Cookie,请参阅编辑 web 应用程序在 SharePoint 服务器的常规设置。本文也适用于 SharePoint Server 2016。