Поделиться через


Использование средств профилирования данных

Средства профилирования данных предоставляют новые и интуитивно понятные способы очистки, преобразования и понимания данных в Редактор Power Query. К ним относятся:

  • Качество столбца

  • Распределение по столбцу

  • Профиль столбца

Чтобы включить средства профилирования данных, перейдите на вкладку "Вид " на ленте. В Power Query Desktop включите нужные параметры в группе предварительного просмотра данных, как показано на следующем рисунке.

Screenshot of the Data profiling tools selected under the Power Query View tab.Снимок экрана: средства профилирования данных, выбранные на вкладке Power Query View.

В Power Query Online выберите представление данных, а затем включите нужные параметры в раскрывающемся списке.

Screenshot of the data profiling tools selected under Data view in the View tab.Снимок экрана: средства профилирования данных, выбранные в представлении данных на вкладке "Вид".

После включения параметров сведения о профилировании данных отображаются в редакторе Power Query.

Screenshot of the data profiling tools after they're set up.Снимок экрана: средства профилирования данных после настройки.

Примечание.

По умолчанию Power Query выполняет профилирование этих данных по первым 1000 строкам данных. Чтобы он работал над всем набором данных, выберите профилирование столбцов на основе сообщения верхнего 1000 строк в левом нижнем углу окна редактора, чтобы изменить профилирование столбцов на профилирование столбцов на основе всего набора данных.

Качество столбца

Значения меток функции качества столбцов в строках в пяти категориях:

  • Допустимая, показанная зеленым цветом.

  • Ошибка, показанная красным цветом.

  • Пустой, показанный темно-серым.

  • Неизвестный, показанный тире зеленым цветом. Указывает, когда в столбце возникают ошибки, качество оставшихся данных неизвестно.

  • Непредвиденная ошибка, показанная в тире красным цветом.

Эти индикаторы отображаются непосредственно под именем столбца в составе небольшой линейчатой диаграммы.

Screenshot of the enhanced view of the bar chart with data quality indicators and labels above each column in the table.Снимок экрана: расширенное представление линейчатой диаграммы с индикаторами качества данных и метками над каждым столбцом в таблице.

Число записей в каждой категории качества столбцов также отображается в процентах.

При наведении указателя мыши на любой из столбцов отображается числовое распределение значений по всему столбцу. Кроме того, при выборе кнопки с многоточием (...) открываются некоторые кнопки быстрого действия для операций со значениями.

Screenshot of the distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.Снимок экрана: распределение столбца имен с допустимыми именами 701 (100 процентов), ноль ошибок и ноль пустых с отображаемыми командами быстрого действия.

Распределение по столбцу

Эта функция предоставляет набор визуальных элементов под именами столбцов, демонстрирующих частоту и распределение значений в каждом столбце. Данные в этих визуализациях сортируются в порядке убывания от значения с наибольшей частотой.

Screenshot of the data profiling tools with the upper column distribution emphasized.Снимок экрана: средства профилирования данных с выделенным распределением верхнего столбца.

Наведите указатель мыши на данные распределения в любом из столбцов, вы получите сведения об общих данных в столбце (с уникальным числом и уникальными значениями). Отдельные ссылки на общее количество разных значений в каждом столбце. Уникальный относится к значениям, имеющим только один экземпляр в столбце. Вы также можете выбрать кнопку с многоточием и выбрать из меню доступных операций.

Screenshot of the data profiling tools with the column distributions options emphasized.Снимок экрана: средства профилирования данных с выделенными параметрами распределения столбцов.

Профиль столбца

Эта функция обеспечивает более подробный обзор данных в столбце. Помимо диаграммы распределения столбцов, она содержит диаграмму статистики столбцов. Эти сведения отображаются в разделе предварительного просмотра данных.

Screenshot of the data profiling tool with the column profile emphasized.Снимок экрана: средство профилирования данных с выделенным профилем столбца.

Фильтрация по значению

Вы можете взаимодействовать с диаграммой распределения значений справа и выбрать любую из полос, наведите указатель мыши на части диаграммы.

Screenshot demonstrating how to hover over the bar in value distribution bar chart, which shows individual data for that bar.Снимок экрана, показывающий, как навести указатель мыши на линейчатую диаграмму распределения значений, в которой показаны отдельные данные для этой панели.

Щелкните правой кнопкой мыши, чтобы отобразить набор доступных преобразований для этого значения.

Screenshot demonstrating how to display the shortcut menu with available transformations for a single bar in the value distribution bar chart.Снимок экрана: отображение контекстного меню с доступными преобразованиями для одной панели в линейчатой диаграмме распределения значений.

Копирование данных

В правом верхнем углу разделов статистики столбца и распределения значений можно выбрать кнопку с многоточием (...), чтобы отобразить контекстное меню копирования . Выберите его, чтобы скопировать данные, отображаемые в любом разделе в буфер обмена.

Screenshot of the copy shortcut menu in the column statistics column.Снимок экрана: контекстное меню копирования в столбце статистики столбца.

Группировать по значению

При нажатии кнопки с многоточием (...) в правом верхнем углу диаграммы распределения значений в дополнение к копированию можно выбрать группу. Эта функция группируйте значения в диаграмме набором доступных параметров.

Screenshot of the copy and group by shortcut menu in the value distribution column.Снимок экрана: копирование и группирование по контекстном меню в столбце распределения значений.

На следующем рисунке показан столбец имен продуктов, сгруппированных по длине текста. После группировки значений на диаграмме можно взаимодействовать с отдельными значениями на диаграмме, как описано в разделе "Фильтр по значению".

Screenshot of the new bar chart showing the distribution of the text length of store names in the table's Names column.Снимок экрана: новая линейчатая диаграмма с распределением длины текста имен хранилища в столбце "Имена таблицы".