Поделиться через


Работа с повторяющимися значениями

Вы можете работать с повторяющимися наборами значений с помощью преобразований, которые могут удалять дубликаты из данных. Вы также можете отфильтровать данные только для отображения повторяющихся данных, чтобы сосредоточиться на них.

Предупреждение

Power Query учитывает регистр. При работе с повторяющимися значениями Power Query рассматривает случай текста, что может привести к нежелательным результатам. В качестве обходного решения пользователи могут применять преобразование верхнего или нижнего регистра перед удалением дубликатов.

В этой статье примеры используют следующую таблицу с столбцами ID, Category и Total .

Снимок экрана: начальная таблица образца, содержащая столбцы ID, Category и Total.

Удаление дубликатов

Одной из операций, которые можно выполнить, является удаление повторяющихся значений из таблицы.

  1. Выберите столбцы, содержащие повторяющиеся значения.

  2. Перейдите на вкладку "Главная ".

  3. В группе "Уменьшить строки" выберите "Удалить строки".

  4. В раскрывающемся меню выберите "Удалить дубликаты".

    Снимок экрана: расположение параметра

Предупреждение

При удалении повторяющихся экземпляров не гарантируется, что первый экземпляр в наборе дубликатов будет выбран. Чтобы узнать больше о сохранении сортировки, перейдите в раздел "Сохранить сортировку".

Удаление дубликатов из нескольких столбцов

В этом примере необходимо определить и удалить дубликаты с помощью всех столбцов из таблицы.

Снимок экрана: начальная таблица с дубликатами в нескольких столбцах.

У вас есть четыре строки, которые дублируются. Ваша цель состоит в удалении этих повторяющихся строк, поэтому в таблице есть только уникальные строки. Выберите все столбцы из таблицы и нажмите кнопку "Удалить дубликаты".

Результат этой операции дает вам таблицу, которую вы ищете.

Снимок экрана: окончательная таблица с дубликатами, удаленными из всех столбцов.

Примечание.

Эта операция также может выполняться с подмножеством столбцов.

Удаление дубликатов из одного столбца

В этом примере необходимо определить и удалить дубликаты с помощью только столбца категории из таблицы.

Снимок экрана: начальная таблица, которая идентифицирует дубликаты в столбце

Вы хотите удалить эти дубликаты и сохранить только уникальные значения. Чтобы удалить дубликаты из столбца категории , выберите его, а затем нажмите кнопку "Удалить дубликаты".

Результат этой операции дает вам таблицу, которую вы ищете.

Снимок экрана: окончательная таблица с дубликатами, удаленными из столбца

Сохранение дубликатов

Другая операция, выполняемая с дубликатами, заключается в сохранении только повторяющихся данных в таблице.

  1. Выберите столбцы, содержащие повторяющиеся значения.

  2. Перейдите на вкладку "Главная ".

  3. В группе "Уменьшить строки" выберите "Сохранить строки".

  4. В раскрывающемся меню выберите "Сохранить дубликаты".

    Снимок экрана: расположение параметра

Сохранение повторяющихся данных из нескольких столбцов

В этом примере необходимо определить и сохранить дубликаты с помощью всех столбцов из таблицы.

Снимок экрана: начальная таблица для сохранения дубликатов из нескольких столбцов.

У вас есть четыре строки, которые дублируются. Ваша цель в этом примере заключается в сохранении только повторяющихся строк в таблице. Выберите все столбцы в таблице и нажмите кнопку "Сохранить дубликаты".

Результат этой операции дает вам таблицу, которую вы ищете.

Снимок экрана: окончательная таблица с повторяющимися строками из нескольких столбцов.

Сохранение повторяющихся данных из одного столбца

В этом примере необходимо определить и сохранить дубликаты с помощью только столбца идентификатора из таблицы.

Начальная таблица для сохранения дубликатов из одного столбца.

В этом примере имеется несколько дубликатов, и вы хотите сохранить только эти дубликаты из таблицы. Чтобы сохранить дубликаты из столбца идентификатора, выберите столбец идентификатора и нажмите кнопку "Сохранить дубликаты".

Результат этой операции дает вам таблицу, которую вы ищете.

Окончательная таблица с повторяющимися строками из одного столбца.

Средства профилирования данных