分析师体验中的数据质量

管理员负责上传组织数据。 但是,作为分析师,你可能希望或系统提示你检查上传的数据的质量。 本文讨论什么是低质量数据和缺失数据,以及如何识别这些数据。

关于缺失和低质量数据

缺少数据

缺少数据意味着某些员工属性(即列)不在管理员上传的组织数据中。 由于员工属性与见解相关联,因此缺少属性会导致缺少见解。

低质量数据和覆盖率

Viva Insights 使用 覆盖率 来确定低质量属性。 覆盖率是组织数据文件中不为空的行的百分比。

在组织数据文件中,每个列标题都包含属性名称,这些列中的每一行都包含属性值。 如果列没有空白行,则此属性具有 较高的覆盖率。 如果列的空白行过多,则此属性 的覆盖率较低。 覆盖率小于 30% 的属性被视为 低质量。 与缺少见解类似,当数据质量低时,相关见解的质量也很低。

在下图中,左侧的 属性 “组织”具有较高的覆盖率。 右侧的属性 TimeZone 覆盖率较低。 如果管理员将此数据上传到高级见解应用,Viva Insights 会将 TimeZone 视为低质量属性。

显示完全覆盖属性和低覆盖率属性的屏幕截图。

查看数据质量

高级见解应用中的两个页面告知你有关数据质量的信息:数据中心和组织数据。 可以通过从应用的左窗格中选择这些页面来访问这些页面。

在数据中心

使用 “数据中心 ”页查看以下项的数量:

  • 缺少或低质量的见解
  • 可用见解
  • 缺少或低质量的数据字段
  • 自上次刷新数据以来的天数

还可以根据可能的见解总数查看 Viva Insights 中显示的见解百分比。 当管理员添加更多组织数据时,将有更多见解可用,并且此百分比会增加。

如果上传的数据中缺少字段,则可以在 缺少或低质量见解和数据字段 标头下方的列表中找到它们。 选择缺少的见解以查看其相关数据字段,反之亦然。 若要从此列表中删除见解,管理员需要将相关数据字段 () 上传到高级见解应用。

在“组织数据”页上

使用此页可以查看特定于属性的信息,包括:

  • 质量分数,表示属性的 覆盖率
  • 上次更新,其中列出了管理员上次上传此属性 Viva Insights 的时间。
  • 具有此字段的员工,该字段显示组织数据中有多少员工具有此属性的值。
  • 唯一值,显示属性的唯一值数。

联系管理员

若要解决下面介绍的数据质量错误和警告,或解决 数据中心缺少的见解,可能需要让管理员重新上传组织数据。 “ 联系人管理员 ”页提供组织的管理员及其联系信息的列表,并提供一个按钮,用于直接向他们发送电子邮件。 访问应用的左窗格上的 “联系人管理员 ”页。

查询中的属性质量通知

在生成自定义查询或 Power BI 查询时,你可能会注意到有关属性质量的警告。 这些警告可以在三个位置出现:

  • 使用低质量属性的指标
  • 在筛选器中,在条件语句中使用低质量属性时
  • 在选择的低质量属性上

除了有关特定指标和属性的警告外,页面顶部还会显示一个横幅。

由于管理员对组织数据进行了更新,因此属性质量可能会随着时间的推移而变化。 设置查询时,Viva Insights 计算所选时间段的属性质量。

在自定义查询中

指标警告

低质量属性可能会影响指标。 让我们使用一个示例。 在查询中,你想要添加一个指标,用于计算人们在营销部门组织的会议中花费的时间。 此指标取决于标识营销部门人员的员工属性。 如果该属性的质量较低,则指标不会包含正常工作所需的所有信息。

如果组织数据包含低质量属性,你可能会注意到指标上有黄色警告标记。 若要找出哪个属性导致指标出现警告,请将鼠标悬停在指标名称上。 警告将显示如下内容:

The low quality of TimeZone is affecting this metric

即使指标有警告,你仍然可以在查询中使用它。

筛选器上的警告

使用筛选器时,无论是创建自定义指标还是选择要包含在查询中的员工或会议,你可能会注意到条件语句 () 的属性警告。 如果属性的质量较低,应用会用警告图标标记它,但你仍然可以在筛选器中使用它。

有关属性的警告

设置查询时,将选择要包含查询的员工属性。 与指标类似,应用将使用警告图标标记低质量员工属性。 即使 属性具有警告,你仍然可以在查询中使用它。

在 Power BI 模板查询中

在 Power BI 模板查询中,可能会遇到数据质量错误和/或警告。 让我们讨论这些通知的显示时间。

预选指标的警告或错误

Power BI 模板使用指标来生成见解。 为了确保模板正确显示这些见解,我们在 Power BI 模板查询中预先选择了指标。 预选指标显示为灰色,无法删除它们。 如果预选指标使用低质量属性,应用将使用警告来标记该指标。 将鼠标悬停在警告图标上可获取低质量属性的名称。 如果查询有警告,你仍然可以运行它并将结果加载到 Power BI 中。

注意

现在,Power BI 报表不会显示哪些见解使用已标记的指标。

筛选器上的警告或错误

筛选器上的警告与 自定义查询中的警告相同。

有关员工属性的警告或错误

基本属性

Power BI 模板需要某些基本属性才能正常工作。 这些属性以灰色显示,你无法删除它们。

如果基本属性的质量较低,应用会用警告来标记它们。 如果查询具有低质量的基本属性,你仍然可以运行它并将结果加载到 Power BI 中。

注意

现在,Power BI 报表不会显示哪些见解使用已标记的指标。

如果组织数据中缺少基本属性,应用将标记它们并显示错误,你将无法运行查询或将结果加载到 Power BI 中。 你需要联系管理员才能上传正确的数据。

补充属性

我们还在查询中预选了一些补充属性,这有助于在 Power BI 模板中创建基于筛选器的见解。 如果需要,可以从查询中删除这些属性,但请记住,这样做可能会影响 Power BI 中的某些见解。

如果查询具有低质量的补充属性,或者如果组织数据中缺少补充员工属性,则应用会用警告标记这些属性。 你仍然可以运行查询并将结果加载到 Power BI 中。 但是,缺少或低质量的补充属性将导致模板中缺少或低质量的见解。

查询结果中的数据质量通知

“查询结果 ”页上,你可能会注意到查询名称旁边的警告。 这些警告可能由于一些原因而出现。 也许你运行了一个查询,知道它使用了低质量的属性。 或者,查询在运行时可能没有任何低质量属性,但在最近上传数据后,某些属性的质量下降。

如果发现数据质量警告,请选择查询的名称或 查看查询。 应用将显示哪些属性的质量较低。