处理重复值

可以通过转换处理重复的值集,这些转换可以删除数据中的重复项。 或者,可以筛选数据以仅显示重复项,以便可以专注于它们。

警告

Power Query 区分大小写。 使用重复值时,Power Query 会考虑文本的情况,这可能会导致意外的结果。 解决方法是,用户可以在删除重复项之前应用大写或小写转换。

对于本篇文章,示例使用下表,其中包含 IDCategoryTotal 列。

包含 ID、类别和总计列的初始示例表的屏幕截图。

删除重复项

可以执行的作之一是从表中删除重复值。

  1. 选择包含重复值的列。

  2. 转到“ 开始 ”选项卡。

  3. 在“ 减少行 ”组中,选择“ 删除行”。

  4. 从下拉菜单中选择“ 删除重复项”。

    显示“删除行”下“删除重复项”选项的位置的屏幕截图。

警告

不能保证删除重复项时,将选择一组重复项中的第一个实例。 若要详细了解如何保留排序,请转到 “保留排序”。

从多个列中删除重复项

在此示例中,你想要使用表中的所有列来标识和删除重复项。

初始表格中的多列重复项已被突出显示,截图如下。

有四行是重复的。 目标是删除这些重复行,以便表中只有唯一行。 从表中选择所有列,然后选择“ 删除重复项”。

该操作的结果会生成您要查找的表格。

从所有列中删除重复项的最终表的屏幕截图。

注释

也可以使用列的子集来执行此操作。

从单个列中删除重复项

在此示例中,你希望仅使用表中的 Category 列来标识和删除重复项。

标识类别列中重复项的初始表的屏幕截图。

你想要删除这些重复项,并且只保留唯一值。 若要从 “类别” 列中删除重复项,请选择它,然后选择“ 删除重复项”。

该操作的结果会生成您要查找的表格。

从“类别”列中删除重复项的最终表的屏幕截图。

保留重复项

可以执行的另一个操作是仅保留表中找到的重复项。

  1. 选择包含重复值的列。

  2. 转到“ 开始 ”选项卡。

  3. 在“ 减少行 ”组中,选择“ 保留行”。

  4. 从下拉菜单中,选择“ 保留重复项”。

    显示“保留重复项”选项在“保留行”下的位置的屏幕截图。

保留来自多个列的重复项

在此示例中,你想要通过使用表中的所有列来标识并保留重复项。

初始表的屏幕截图,用于保留多个列中的重复项。

有四行是重复的。 本示例中的目标是仅保留表中重复的行。 选择表格中的所有列,然后选择“ 保留重复项”。

该操作的结果会生成您要查找的表格。

最终表格的屏幕截图,仅显示来自多个列的重复行。

从单个列保留重复项

在此示例中,你希望仅使用表中的 ID 列来标识并保留重复项。

用于从单个列保留重复项的初始表。

在此示例中,你拥有多个重复项,并且希望只保留表中的那些重复项。 若要从 ID 列保留重复项,请选择 ID 列,然后选择“ 保留重复项”。

该操作的结果会生成您要查找的表格。

仅包含单个列中重复行的最终表。

数据分析工具