Поделиться через


Типы визуализаций панели мониторинга

В этой статье описываются типы визуализаций, доступные для использования на панелях мониторинга ИИ/BI, и показано, как создать пример каждого типа визуализации. Инструкции по созданию панели мониторинга см. в статье "Создание панели мониторинга". Вы можете использовать естественный язык, чтобы предложить помощнику создать диаграммы с полосами, линейные, точечные карты, точечные, круговые и диаграммы счетчика. См. Создание визуализаций с помощником Databricks.

Замечание

Для оптимизации производительности диаграммы могут отображать только 10K строк или 10 МБ на холсте, в зависимости от того, что меньше. В противном случае визуализации могут быть усечены.

Визуализация областей

Визуализации областей объединяют визуализации линий и линейчатой диаграммы, чтобы показать, как числовые значения одной или нескольких групп изменяются при прогрессии второй переменной, как правило, времени. Эти диаграммы часто используются, чтобы показать изменений воронки продаж с течением времени.

Чтобы изменить макет, выполните следующие действия.

  • Щелкните значок меню Kebab в секции Y-оси панели редактирования.
  • В разделе "Макет" выберите Stack или 100% Stack.

Пример визуализации областей

Значения конфигурации: для предоставленного примера визуализации области были заданы следующие значения:

  • Набор данных: заказы TPCH
  • Визуализация: область
  • Титул: Total price and order year by order priority and clerk
  • Ось абсцисс:
    • Поле: o_orderdate
    • Тип масштабирования: Temporal
    • Трансформировать: Yearly
    • Название оси: Order year
  • Ось y:
    • Поле: o_totalprice
    • Название оси: Total price
    • Тип масштабирования: Quantitative
    • Трансформировать: Sum
  • Группировать по:
    • Поле: o_orderpriority
    • Название условных обозначений: Order priority
  • Фильтр
    • Поле: TPCH orders.o_clerk

SQL-запрос. Для визуализации этой области используется следующий SQL-запрос для создания набора данных с именем TPCH orders.

SELECT * FROM samples.tpch.orders

Столбчатая диаграмма

Линейчатые диаграммы представляют изменение метрик с течением времени или между категориями и показывают пропорциональность, аналогичную визуализации круговой диаграммы.

Пример визуализации линейчатой панели

Чтобы изменить макет, выполните следующие действия.

  • Щелкните значок меню Kebab в секции Y-оси панели редактирования.
  • В разделе "Макет" выберите Stack или 100% Stack или Group.

Значения конфигурации: для предоставленного примера линейчатой диаграммы были заданы следующие значения:

  • Набор данных: заказы TPCH
  • Визуализация: панель
  • Титул: Total price and order month by order priority and clerk
  • Ось абсцисс:
    • Поле: o_orderdate
    • Трансформировать: Monthly
    • Тип масштабирования: Temporal
    • Название оси: Order month
  • Ось y:
    • Поле: o_totalprice
    • Тип масштабирования: Quantitative
    • Трансформировать: Sum
    • Название оси: Total price
  • Группировать по:
    • Поле: o_orderpriority
    • Название условных обозначений: Order priority
  • Фильтр
    • Поле: TPCH orders.o_clerk

SQL-запрос: следующий SQL-запрос создал набор TPCH orders данных для этой визуализации панели.

SELECT * FROM samples.tpch.orders

Ящиковая диаграмма

Визуализация прямоугольной диаграммы показывает сводку распределения числовых данных, при необходимости сгруппированную по категориям. С помощью визуализации диаграммы можно быстро сравнить диапазоны значений между категориями и визуализировать локальность, распространение и отклонение групп значений через их квартиль. В каждом поле темная линия показывает межквартильный диапазон. Дополнительные сведения об интерпретации ящичных графиков см. в статье «Диаграмма размаха» на Википедии.

Пример диаграммы

Для предоставленного примера прямоугольной диаграммы были заданы следующие значения:

  • Столбец X (столбец набора данных): l-returnflag
  • Столбцы Y (столбец набора данных): l_extendedprice
  • Заголовок оси X: Return flag1
  • Название оси Y: Extended price

SQL-запрос. Для визуализации этой диаграммы для создания набора данных использовался следующий SQL-запрос.

select * from samples.tpch.lineitem

Пузырьковая диаграмма

Пузырьковые диаграммы — это точечные диаграммы, где размер каждого маркера точек отражает соответствующую метрику. Чтобы сделать пузырьковую диаграмму, выберите "Точечная " в качестве типа визуализации. В параметре "Размер" выберите нужную метрику, представленную размером маркеров.

Пример визуализации пузырьковой диаграммы

Значения конфигурации: для предоставленного примера пузырьковой диаграммы были заданы следующие значения:

  • Набор данных: поездки на такси Нью-Йорка
  • Визуализация: диаграмма рассеяния
  • Титул: Trip distance, fares, and trip duration
  • Ось абсцисс:
    • Поле: trip_distance
    • Тип масштабирования: Quantitative
    • Трансформировать: None
  • Ось y:
    • Поле: fare_amount
    • Тип масштабирования: Quantitative
    • Трансформировать: None
  • Цвет по:
    • Поле: pickup_zip
  • Размер:
    • Поле: time_spent
    • Трансформировать: None

Карта Хороплет

В хороплетных визуализациях географические области, такие как страны или штаты, окрашиваются в соответствии с суммарными значениями каждого ключевого столбца. Запрос должен возвращать географические объекты по имени. Пользователи могут создавать карты, отображающие административные границы на уровне страны, штата или провинции, а также округа или района.

Пример карты Choropleth

Значения конфигурации: для этой хороплетной визуализации были заданы следующие значения:

  • Набор данных: tcph nation
  • Страна: Country
  • Цвет: sum(c_acct_bal)

SQL-запрос. Для этой визуализации хороплей для создания набора данных использовался следующий SQL-запрос.

SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1

Диаграмма со списком

Комбо-диаграммы объединяют линии и линейчатые диаграммы, чтобы представить изменения с течением времени с пропорциональностью.

Пример комбинированной диаграммы

Значения конфигурации: для этой визуализации комбинированной диаграммы были заданы следующие значения:

  • Набор данных: partsupp
  • Визуализация: комбо
  • Ось абсцисс: ps_partkey
    • Тип масштабирования: Quantitative
  • Ось y:
    • Бар: ps_availqty
    • Тип агрегирования: SUM
    • Линия: ps_supplycost
    • Тип агрегирования: AVG
  • Цвет по серии Y:
    • Sum of ps_availqty
    • Average ps_supplycost

SQL-запрос: Для этой визуализации составной диаграммы использовался следующий SQL-запрос для создания набора данных.

SELECT * FROM samples.tpch.partsupp

Комбинированная диаграмма с двумя осями

Для отображения двух разных осей Y можно использовать комбинированные диаграммы. Выбрав мини-приложение комбинированной диаграммы, щелкните значок меню "Kebab" на параметрах оси Y в панели конфигурации диаграммы. Включите параметр "Включить двойную ось ".

Пример комбинированной диаграммы с двойной осью

Значения конфигурации: для этой смешанной диаграммы опция Двойная ось включена. Другие конфигурации задаются следующим образом:

  • Набор данных: Поездки
  • Визуализация: комбо
  • Ось абсцисс: tpep_pickup_datetime
    • Тип масштабирования: Temporal
    • Трансформировать: Weekly
  • Ось y:
    • Левая ось Y (полоса): trip_distance
      • Трансформировать: AVG
    • Правая ось Y (линия): fare_amount
      • Трансформировать: AVG

Цвет по серии Y:

  • Average trip_distance
    • Average fare_amount

SQL-запрос: следующий SQL-запрос использовался для создания набора данных:

SELECT * FROM samples.nyctaxi.trips

Визуализация счетчиков

Счетчики отображают одно значение в видном виде, с параметром сравнения их с целевым значением. Чтобы использовать счетчики, укажите, какие данные будут отображаться в визуализации счетчиков для столбцов Value и Target . При применении агрегирования в редакторе визуализации нельзя сравнить значения, выбрав номер строки "Значение", как показано в следующем примере. Чтобы сравнить определенные значения строк, используйте набор данных, содержащий все необходимые агрегаты в SQL, который определяет его. Это позволяет выбрать строки целей и значений для их сравнения.

Пример счетчика

В конфигурации Value можно задать условное форматирование и настроить стиль текста.

Параметры условного форматирования для отображаемой диаграммы счетчиков.

Значения конфигурации: для этого примера визуализации счетчика были заданы следующие значения:

  • Набор данных: контрпример
  • Визуализация: счетчик
  • Титул: Orders: Total price by date (previous two days)
  • Значение:
    • Поле: total price
    • Номер строки значения: 1
  • Цель:
    • Поле: total price
    • Номер строки значения: 2

SQL-запрос. Для визуализации этого счетчика для создания набора данных использовался следующий SQL-запрос:

SELECT
  SUM(o_totalprice) as `total price`,
  o_orderdate
FROM
  samples.tpch.orders
GROUP BY o_orderdate
ORDER BY o_orderdate DESC

Визуализация строк

Визуализации строк представляют собой изменение одной или нескольких метрик с течением времени.

Пример визуализации строк

Значения конфигурации: для этого примера визуализации строк были заданы следующие значения:

  • Набор данных: заказы TPCH
  • Визуализация: линия
  • Титул: Average price and order year by order priority and clerk
  • Ось абсцисс:
    • Поле: o_orderdate
    • Трансформировать: Yearly
    • Тип масштабирования: Temporal
    • Название оси: Order year
  • Ось y:
    • Поле: o_totalprice
    • Трансформировать: Average
    • Тип масштабирования: Quantitative
    • Название оси: Average price
  • Группировать по:
    • Поле: o_orderpriority
    • Название условных обозначений: Order priority
  • Фильтр
    • Поле: TPCH orders.o_clerk

SQL-запрос. Для визуализации этой визуализации линейчатой диаграммы для создания набора данных с именем TPCH ordersиспользовался следующий SQL-запрос.

SELECT * FROM samples.tpch.orders

Диаграмма тепловой карты

Диаграммы тепловой карты смешивают функции линейчатых диаграмм, стеков и пузырьковых диаграмм, что позволяет визуализировать числовые данные с помощью цветов. Общая цветовая палитра для тепловой карты показывает самые высокие значения с использованием более теплых цветов, таких как оранжевый или красный, и самые низкие значения с использованием более холодных цветов, таких как синий или фиолетовый.

Например, следующая тепловая карта визуализирует наиболее часто встречающиеся расстояния поездок на такси каждый день и группирует результаты по дням недели, расстоянию и общей стоимости поездки.

Замечание

Тепловая карта может отображать до 64 тысяч строк или 10 МБ.

Пример тепловой карты

Значения конфигурации: для визуализации диаграммы тепловой карты были заданы следующие значения:

  • Набор данных: заказы TPCH
  • Визуализация: тепловая карта
  • Столбец X (столбец набора данных): o_orderpriority
  • Столбцы Y (столбец набора данных): o_orderstatus
  • Столбец цвета:
    • Столбец набора данных: o_totalprice
    • Тип агрегирования: Average
  • Имя оси X (переопределение значения по умолчанию): Order priority
  • Имя оси Y(переопределение значения по умолчанию): Order status
  • Цветовая схема (переопределение значения по умолчанию): YIGnBu

SQL-запрос. Для визуализации диаграммы тепловой карты для создания набора данных использовался следующий SQL-запрос.

SELECT * FROM samples.tpch.orders

Гистограмма

Гистограмма отображает частоту появления определенного значения в наборе данных. Гистограмма помогает понять, имеет ли набор данных значения, кластеризованные вокруг небольшого количества диапазонов или более распределенные. Гистограмма отображается в виде линейчатой диаграммы, в которой вы управляете количеством разных полос (также называемых ячейками).

Пример гистограммы

Значения конфигурации: для визуализации гистограммы были заданы следующие значения:

  • Набор данных: заказы TPCH
  • Визуализация: гистограмма
  • Столбец X (столбец набора данных): o_totalprice
  • Количество ячеек: 20
  • Имя оси X (переопределение значения по умолчанию): Total price

Параметры конфигурации: для параметров конфигурации гистограммы см. параметры конфигурации гистограммы.

SQL-запрос. Для визуализации диаграммы гистограммы для создания набора данных использовался следующий SQL-запрос.

select * from samples.tpch.orders

Визуализация круговой диаграммы

Визуализации круговой диаграммы показывают пропорциональность между метриками. Они не предназначены для передачи данных временных рядов.

Пример визуализации круговой диаграммы

Значения конфигурации: для этого примера визуализации круговой диаграммы были заданы следующие значения:

  • Набор данных: заказы TPCH
  • Визуализация: визуализация круговой диаграммы
  • Титул: Total price by order priority and clerk
  • Угол:
    • Поле: o_totalprice
    • Трансформировать: Sum
    • Название оси: Total price
  • Группировать по:
    • Поле: o_orderpriority
    • Название условных обозначений: Order priority
  • Фильтр
    • Поле: TPCH orders.o_clerk

SQL-запрос: Для этой круговой диаграммы использовался следующий SQL-запрос для создания набора данных с именем TPCH orders.

SELECT * FROM samples.tpch.orders

Визуализация сводной таблицы

Сводная визуализация агрегирует записи из результатов запроса в табличный вид. Он похож на PIVOT инструкции или GROUP BY инструкции в SQL. Вы настраиваете сводную визуализацию с помощью перетаскивания полей.

Замечание

По соображениям производительности сводные таблицы поддерживают отрисовку только 100 столбцов x 100 строк.

Пример сводной таблицы

Значения конфигурации: для этого примера визуализации с использованием сводной таблицы были заданы следующие значения:

  • Набор данных: TPCH lineitem
  • Визуализация: сводная диаграмма
  • Титул: Line item quantity by return flag and ship mode by supplier
  • Строки
    • Поле: l_returnflag
  • Столбцы:
    • Поле: l_shipmode
  • Ячейка
    • Набор данных:
    • Поле: l_quantity
    • Преобразование: Сумма
  • Фильтр
    • Поле: TPCH lineitem.l_supplierkey

SQL-запрос: Для этой сводной визуализации использовался следующий SQL-запрос для создания набора данных с именем TPCH lineitem.

SELECT * FROM samples.tpch.lineitem

Карта точек

Карты точек отображают количественные данные в виде символов, размещенных в определенных расположениях карты. Маркеры размещаются с помощью координат широты и долготы, которые должны быть включены в результирующий набор для этого типа диаграммы. В следующем примере используются данные из столкновений транспортных средств в Нью-Йорке, штат Нью-Йорк.

Пример карты точек

Значения конфигурации: для визуализации карты точек были заданы следующие значения:

  • Набор данных: Анализ цен на жилье в Сиэтле
  • Визуализация: карта точек
  • Координаты:
    • Широта: LATITUDE
    • Долгота: LONGITUDE
  • Цвет:
    • Поле: avg(bedrooms)
      • Тип масштабирования: категориальный
  • Размер:
    • Поле: avg(price)

Замечание

Наборы данных Databricks не включают данные широты или долготы, поэтому пример SQL-запроса не указан для этого примера.

Схема Sankey

Схема sankey визуализирует поток из одного набора значений в другой.

Пример Sankey

Значения конфигурации: для этой схемы sankey были заданы следующие значения:

  • Набор данных: пример Sankey
  • Визуализация: Sankey
  • Этапы
    • stage1
    • stage2
  • Ценность
    • СУММ(value)

SQL-запрос. Для этой визуализации Sankey для создания набора данных использовался следующий SQL-запрос.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Точечная визуализация

Точечные визуализации обычно используются для отображения связи между двумя числовыми переменными. Можно закодировать третье измерение цветом, чтобы показать, как числовые переменные отличаются между группами.

Пример рассеяния

Значения конфигурации: для этого примера диаграммы рассеяния были заданы следующие значения:

  • Набор данных: TPCH lineitem
  • Визуализация: диаграмма рассеяния
  • Титул: Total price and quantity by ship mode and supplier
  • Ось абсцисс:
    • Поле: l_quantity
    • Название оси: Quantity
    • Тип масштабирования: Quantitative
    • Трансформировать: None
  • Ось y:
    • Поле: l_extendedprice
    • Тип масштабирования: Quantitative
    • Трансформировать: None
    • Название оси: Price
  • Группировать по:
    • Поле: l_shipmode
    • Название условных обозначений: Ship mode
  • Фильтр
    • Поле: TPCH lineitem.l_supplierkey

SQL-запрос: Для этой визуализации использовался следующий SQL-запрос для создания набора данных с именем TPCH lineitem.

SELECT * FROM samples.tpch.lineitem

Визуализация таблиц

Визуализация таблицы показывает данные в стандартной таблице, но позволяет вручную переупорядочение, скрытие и форматирование данных.

Замечание

Таблицы могут отображать до 64 КБ строк или 10 МБ.

Пример таблицы

Значения конфигурации: для этого примера визуализации таблицы были заданы следующие значения:

  • Набор данных: TPCH lineitem
  • Визуализация: таблица
  • Титул: Line item summary by supplier
  • Столбцы:
    • Отображение номера строки: включено
    • Поле: l_orderkey
    • Поле: l_extendedprice
      • Отображается как: Number
      • Числовой формат (доллары США): $0,00
    • Поле: l_discount
      • Отображается как: Number
      • Формат чисел: %0.00
    • Поле: l_tax
      • Отображается как: Number
      • Формат чисел: %0.00
    • Поле: l_shipdate
    • Поле: l_shipmode
  • Фильтр
    • Поле: TPCH lineitem.l_supplierkey

Параметры конфигурации. Параметры конфигурации визуализации таблиц см. в разделе "Параметры таблицы".

SQL-запрос. Для визуализации этой таблицы для создания набора данных с именем TPCH lineitemиспользовался следующий SQL-запрос.

SELECT * FROM samples.tpch.lineitem