Поделиться через


Выборка с высокой плотностью в точечной диаграмме Power BI

Алгоритм выборки Power BI улучшает точечную диаграмму, представляющую данные высокой плотности.

Например, можно создать точечную диаграмму из деятельности по продажам вашей организации, при этом каждый магазин имеет десятки тысяч точек данных каждый год. Точечная диаграмма таких сведений приведет к выборке данных из понятного представления этих данных, чтобы продемонстрировать, как с течением времени произошли продажи. Подробные сведения о выборке данных с высокой плотностью описаны в этой статье.

Screenshot of a scatter chart, showing the high-density sampling data.

Примечание.

Алгоритм выборки с высокой плотностью, описанный в этой статье, доступен в точечной диаграмме для Power BI Desktop и служба Power BI.

Как работают точечные диаграммы с высокой плотностью

Ранее Power BI выбрала коллекцию примеров точек данных в полном диапазоне базовых данных детерминированным способом для создания точечной диаграммы. В частности, Power BI выберет первые и последние строки данных в ряде точечной диаграммы, а затем разделить остальные строки равномерно так, чтобы 3500 точек данных были отображены на точечной диаграмме. Например, если в примере было 35 000 строк, первые и последние строки будут выбраны для построения, то каждая десятая строка также будет отображаться (35 000 / 10 = каждая десятая строка = 355 500 точек данных). Кроме того, ранее значения NULL или точки, которые не могли быть выложены, например текстовые значения, в рядах данных не отображались, и поэтому не учитывались при создании визуального элемента. При такой выборке предполагаемая плотность точечной диаграммы также основана на репрезентативных точках данных, поэтому подразумеваемая плотность визуальных элементов была обстоятельством выборочных точек, а не полной коллекцией базовых данных.

При включении выборки высокой плотности Power BI реализует алгоритм, который устраняет перекрывающиеся точки и гарантирует, что точки на визуальном элементе можно достичь при взаимодействии с визуальным элементом. Алгоритм также гарантирует, что все точки в наборе данных представлены в визуальном элементе, предоставляя контекст значению выбранных точек, а не просто построения репрезентативного образца.

По определению данные с высокой плотностью выборки используются для создания визуализаций, которые реагируют на интерактивность. Слишком много точек данных на визуальном элементе может замедлить его и отвлечь от видимости тенденций. Способ выборки данных приводит к созданию алгоритма выборки для обеспечения оптимальной визуализации и обеспечения представления всех данных. В Power BI алгоритм улучшается, чтобы обеспечить оптимальное сочетание отклика, представления и четкого сохранения важных точек в общем наборе данных.

Примечание.

Точечные диаграммы, использующие алгоритм выборки высокой плотности, лучше всего выобразуются на квадратных визуальных элементах, как и во всех точечных диаграммах.

Принцип работы алгоритма выборки точечной диаграммы

Алгоритм выборки с высокой плотностью для точечной диаграммы использует методы, которые захватывают и представляют базовые данные более эффективно и устраняют перекрывающиеся точки. Алгоритм начинается с небольшого радиуса для каждой точки данных, которая является размером визуального круга для заданной точки визуализации. Затем он увеличивает радиус всех точек данных. При перекрытии двух или нескольких точек данных один круг увеличенного размера радиуса представляет эти перекрывающиеся точки данных. Алгоритм продолжает увеличивать радиус точек данных, пока это значение радиуса не приведет к разумному количеству точек данных (3500), отображаемых на точечной диаграмме.

Методы в этом алгоритме гарантируют, что выбросы представлены в результирующем визуальном элементе. Алгоритм учитывает масштаб при определении перекрытия, так что экспоненциальные шкалы визуализированы с точностью до базовых визуализированных точек.

Алгоритм также сохраняет общую форму точечной диаграммы.

Примечание.

При использовании алгоритма выборки высокой плотности для точечной диаграммы точное распределение данных является целью, а не подразумеваемой плотностью визуальных элементов. Например, можно увидеть точечную диаграмму с большим количеством кругов, перекрывающихся (плотность) в определенной области, и представить, что многие точки данных должны быть кластеризованы там. Так как алгоритм выборки высокой плотности может использовать один круг для представления множества точек данных, такая подразумеваемая плотность визуального элемента или "кластеризация" не будет отображаться. Чтобы получить более подробную информацию в данной области, можно использовать срезы для увеличения масштаба.

Кроме того, точки данных, которые не могут быть выложены, такие как значения NULL или текстовые значения, игнорируются, поэтому выбрано другое значение, которое можно вывести. Это позволяет обеспечить правильную форму точечной диаграммы.

Если используется стандартный алгоритм для точечной диаграммы

Существуют обстоятельства, при которых выборка с высокой плотностью не может применяться к точечной диаграмме и используется исходный алгоритм. Эти обстоятельства:

  • Если щелкнуть правой кнопкой мыши значение в разделе "Значения" и задать его для отображения элементов без данных из меню, точечная диаграмма будет отменить изменения исходному алгоритму.

    Screenshot of the Visualization menu, showing the Values pane with Show items with no data selection.

  • Любые значения в поле "Ось воспроизведения" будут приводить к отменить изменения точечной диаграмме, отменить изменения исходному алгоритму.

  • Если на точечной диаграмме отсутствуют оси X и Y, диаграмма отменить изменения исходному алгоритму.

  • Использование строки коэффициента в области аналитики приводит к отменить изменения диаграммы исходному алгоритму.

    Screenshot of the Visualization menu, showing a pointer to the Analytics pane and Ratio line.

Включение выборки с высокой плотностью для точечной диаграммы

Чтобы переключить выборку с высокой плотностью на "Вкл.", выберите точечную диаграмму, перейдите в область "Формат", разверните раздел "Общие карта" и в нижней части этого карта переместите ползунок выборки высокой плотностив положение "Вкл".

Screenshot of the Visualization menu, showing a pointer to the Format visual pane, General card, and High Density Sampling toggle slider.

Примечание.

После включения коммутатора Power BI попытается использовать алгоритм выборки высокой плотности по возможности. Если алгоритм не может использоваться, например при размещении значения в оси воспроизведения, переключатель остается включено, несмотря на то, что диаграмма отменить изменения к стандартному алгоритму. При удалении значения из оси воспроизведения или при изменении условий для включения использования алгоритма выборки высокой плотности диаграмма будет автоматически использовать выборку с высокой плотностью для этой диаграммы, так как эта функция активна.

Примечание.

Точки данных группируются или выбираются индексом. Наличие условных обозначений не влияет на выборку алгоритма. Это влияет только на упорядочение визуального элемента.

Рекомендации и ограничения

Алгоритм выборки с высокой плотностью является важным улучшением Power BI. Однако алгоритм выборки высокой плотности работает только с динамическими подключениями к моделям на основе служба Power BI, импортированным моделям или DirectQuery.