Использование средств профилирования данных

Средства профилирования данных предоставляют новые и интуитивно понятные способы очистки, преобразования и понимания данных в Редактор Power Query. К ним относятся:

  • Качество столбца

  • Распределение по столбцу

  • Профиль столбца

Чтобы включить средства профилирования данных, перейдите на вкладку "Вид " на ленте. В Power Query Desktop включите нужные параметры в группе предварительного просмотра данных, как показано на следующем рисунке.

Средства профилирования данных.

В Power Query Online выберите представление данных, а затем включите нужные параметры в раскрывающемся списке.

<альтернативный текст>

После включения параметров вы увидите примерно следующее изображение в Редактор Power Query.

Средства профилирования данных включены.

Примечание.

По умолчанию Power Query выполняет профилирование этих данных по первым 1000 строкам данных. Чтобы он работал над всем набором данных, выберите профилирование столбцов на основе сообщения верхнего 1000 строк в левом нижнем углу окна редактора, чтобы изменить профилирование столбцов на профилирование столбцов на основе всего набора данных.

Качество столбца

Значения меток функции качества столбцов в строках в пяти категориях:

  • Допустимая, показанная зеленым цветом.

  • Ошибка, показанная красным цветом.

  • Пустой, показанный темно-серым.

  • Неизвестный, показанный тире зеленым цветом. Указывает, когда в столбце возникают ошибки, качество оставшихся данных неизвестно.

  • Непредвиденная ошибка, показанная в тире красным цветом.

Эти индикаторы отображаются непосредственно под именем столбца в составе небольшой линейчатой диаграммы, как показано на следующем рисунке.

Расширенное представление линейчатой диаграммы с индикаторами качества данных и метками над каждым столбцом в таблице.

Число записей в каждой категории качества столбцов также отображается в процентах.

При наведении указателя мыши на любой из столбцов отображается числовое распределение значений по всему столбцу. Кроме того, при выборе кнопки с многоточием (...) открываются некоторые кнопки быстрого действия для операций со значениями.

Распределение столбцов имен с допустимыми именами 701 (100 процентов), ноль ошибок и ноль пустых с отображаемыми командами быстрого действия.

Распределение по столбцу

Эта функция предоставляет набор визуальных элементов под именами столбцов, демонстрирующих частоту и распределение значений в каждом столбце. Данные в этих визуализациях сортируются в порядке убывания от значения с наибольшей частотой.

Распределение столбцов.

Наведите указатель мыши на данные распределения в любом из столбцов, вы получите сведения об общих данных в столбце (с уникальным числом и уникальными значениями). Вы также можете выбрать кнопку с многоточием и выбрать из меню доступных операций.

Параметры распределения столбцов.

Профиль столбца

Эта функция обеспечивает более подробный обзор данных в столбце. Помимо диаграммы распределения столбцов, она содержит диаграмму статистики столбцов. Эти сведения отображаются в разделе предварительного просмотра данных, как показано на следующем рисунке.

Профиль столбца.

Фильтрация по значению

Вы можете взаимодействовать с диаграммой распределения значений справа и выбрать любую из полос, наведите указатель мыши на части диаграммы.

Наведите указатель мыши на линейчатую диаграмму распределения значений, в которой показаны отдельные данные для этой панели.

Щелкните правой кнопкой мыши, чтобы отобразить набор доступных преобразований для этого значения.

Отображает контекстное меню с доступными tranformations для одной панели в линейчатой диаграмме распределения значений.

Копирование данных

В правом верхнем углу разделов статистики столбца и распределения значений можно выбрать кнопку с многоточием (...), чтобы отобразить контекстное меню копирования . Выберите его, чтобы скопировать данные, отображаемые в любом разделе в буфер обмена.

Копирование статистики столбцов.

Группировать по значению

При нажатии кнопки с многоточием (...) в правом верхнем углу диаграммы распределения значений в дополнение к копированию можно выбрать группу. Эта функция группируйте значения в диаграмме набором доступных параметров.

Группировать по распределению значений.

На рисунке ниже показан столбец имен продуктов, сгруппированных по длине текста. После группировки значений на диаграмме можно взаимодействовать с отдельными значениями на диаграмме, как описано в разделе "Фильтр по значению".

Новая линейчатая диаграмма, показывающая распределение длины текста имен хранилища в столбце