Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье описываются типы визуализаций, доступные для использования на панелях мониторинга ИИ/BI, и показано, как создать пример каждого типа визуализации. Инструкции по созданию панели мониторинга см. в статье "Создание панели мониторинга". Вы можете использовать естественный язык, чтобы предложить помощнику создать диаграммы с полосами, линейные, точечные карты, точечные, круговые и диаграммы счетчика. См. Создание визуализаций с помощником Databricks.
Замечание
Для оптимизации производительности диаграммы могут отображать только 10K строк или 10 МБ на холсте, в зависимости от того, что меньше. В противном случае визуализации могут быть усечены.
Визуализация областей
Визуализации областей объединяют визуализации линий и линейчатой диаграммы, чтобы показать, как числовые значения одной или нескольких групп изменяются при прогрессии второй переменной, как правило, времени. Эти диаграммы часто используются, чтобы показать изменений воронки продаж с течением времени.
Чтобы изменить макет, выполните следующие действия.
- Щелкните
в секции Y-оси панели редактирования.
- В разделе "Макет" выберите Stack или 100% Stack.
Значения конфигурации: для предоставленного примера визуализации области были заданы следующие значения:
- Набор данных: заказы TPCH
- Визуализация: область
- Титул:
Total price and order year by order priority and clerk
- Ось абсцисс:
- Поле:
o_orderdate
- Тип масштабирования:
Temporal
- Трансформировать:
Yearly
- Название оси:
Order year
- Поле:
- Ось y:
- Поле:
o_totalprice
- Название оси:
Total price
- Тип масштабирования:
Quantitative
- Трансформировать:
Sum
- Поле:
- Группировать по:
- Поле:
o_orderpriority
- Название условных обозначений:
Order priority
- Поле:
- Фильтр
- Поле:
TPCH orders.o_clerk
- Поле:
SQL-запрос. Для визуализации этой области используется следующий SQL-запрос для создания набора данных с именем TPCH orders
.
SELECT * FROM samples.tpch.orders
Столбчатая диаграмма
Линейчатые диаграммы представляют изменение метрик с течением времени или между категориями и показывают пропорциональность, аналогичную визуализации круговой диаграммы.
Чтобы изменить макет, выполните следующие действия.
- Щелкните
в секции Y-оси панели редактирования.
- В разделе "Макет" выберите Stack или 100% Stack или Group.
Значения конфигурации: для предоставленного примера линейчатой диаграммы были заданы следующие значения:
- Набор данных: заказы TPCH
- Визуализация: панель
- Титул:
Total price and order month by order priority and clerk
- Ось абсцисс:
- Поле:
o_orderdate
- Трансформировать:
Monthly
- Тип масштабирования:
Temporal
- Название оси:
Order month
- Поле:
- Ось y:
- Поле:
o_totalprice
- Тип масштабирования:
Quantitative
- Трансформировать:
Sum
- Название оси:
Total price
- Поле:
- Группировать по:
- Поле:
o_orderpriority
- Название условных обозначений:
Order priority
- Поле:
- Фильтр
- Поле:
TPCH orders.o_clerk
- Поле:
SQL-запрос: следующий SQL-запрос создал набор TPCH orders
данных для этой визуализации панели.
SELECT * FROM samples.tpch.orders
Ящиковая диаграмма
Визуализация прямоугольной диаграммы показывает сводку распределения числовых данных, при необходимости сгруппированную по категориям. С помощью визуализации диаграммы можно быстро сравнить диапазоны значений между категориями и визуализировать локальность, распространение и отклонение групп значений через их квартиль. В каждом поле темная линия показывает межквартильный диапазон. Дополнительные сведения об интерпретации ящичных графиков см. в статье «Диаграмма размаха» на Википедии.
Для предоставленного примера прямоугольной диаграммы были заданы следующие значения:
- Столбец X (столбец набора данных):
l-returnflag
- Столбцы Y (столбец набора данных):
l_extendedprice
- Заголовок оси X:
Return flag1
- Название оси Y:
Extended price
SQL-запрос. Для визуализации этой диаграммы для создания набора данных использовался следующий SQL-запрос.
select * from samples.tpch.lineitem
Пузырьковая диаграмма
Пузырьковые диаграммы — это точечные диаграммы, где размер каждого маркера точек отражает соответствующую метрику. Чтобы сделать пузырьковую диаграмму, выберите "Точечная " в качестве типа визуализации. В параметре "Размер" выберите нужную метрику, представленную размером маркеров.
Значения конфигурации: для предоставленного примера пузырьковой диаграммы были заданы следующие значения:
- Набор данных: поездки на такси Нью-Йорка
- Визуализация: диаграмма рассеяния
- Титул:
Trip distance, fares, and trip duration
- Ось абсцисс:
- Поле:
trip_distance
- Тип масштабирования:
Quantitative
- Трансформировать:
None
- Поле:
- Ось y:
- Поле:
fare_amount
- Тип масштабирования:
Quantitative
- Трансформировать:
None
- Поле:
- Цвет по:
- Поле:
pickup_zip
- Поле:
- Размер:
- Поле:
time_spent
- Трансформировать:
None
- Поле:
Карта Хороплет
В хороплетных визуализациях географические области, такие как страны или штаты, окрашиваются в соответствии с суммарными значениями каждого ключевого столбца. Запрос должен возвращать географические объекты по имени. Пользователи могут создавать карты, отображающие административные границы на уровне страны, штата или провинции, а также округа или района.
Значения конфигурации: для этой хороплетной визуализации были заданы следующие значения:
- Набор данных:
tcph nation
- Страна:
Country
- Цвет: sum(c_acct_bal)
SQL-запрос. Для этой визуализации хороплей для создания набора данных использовался следующий SQL-запрос.
SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1
Диаграмма со списком
Комбо-диаграммы объединяют линии и линейчатые диаграммы, чтобы представить изменения с течением времени с пропорциональностью.
Значения конфигурации: для этой визуализации комбинированной диаграммы были заданы следующие значения:
- Набор данных: partsupp
- Визуализация: комбо
- Ось абсцисс:
ps_partkey
- Тип масштабирования:
Quantitative
- Тип масштабирования:
- Ось y:
- Бар:
ps_availqty
- Тип агрегирования:
SUM
- Линия:
ps_supplycost
- Тип агрегирования:
AVG
- Бар:
- Цвет по серии Y:
Sum of ps_availqty
Average ps_supplycost
SQL-запрос: Для этой визуализации составной диаграммы использовался следующий SQL-запрос для создания набора данных.
SELECT * FROM samples.tpch.partsupp
Комбинированная диаграмма с двумя осями
Для отображения двух разных осей Y можно использовать комбинированные диаграммы. Выбрав мини-приложение комбинированной диаграммы, щелкните значок меню "Kebab" на параметрах оси Y в панели конфигурации диаграммы. Включите параметр "Включить двойную ось ".
Значения конфигурации: для этой смешанной диаграммы опция Двойная ось включена. Другие конфигурации задаются следующим образом:
- Набор данных: Поездки
- Визуализация: комбо
- Ось абсцисс:
tpep_pickup_datetime
- Тип масштабирования:
Temporal
- Трансформировать:
Weekly
- Тип масштабирования:
- Ось y:
- Левая ось Y (полоса):
trip_distance
- Трансформировать:
AVG
- Трансформировать:
- Правая ось Y (линия):
fare_amount
- Трансформировать:
AVG
- Трансформировать:
- Левая ось Y (полоса):
Цвет по серии Y:
Average trip_distance
Average fare_amount
SQL-запрос: следующий SQL-запрос использовался для создания набора данных:
SELECT * FROM samples.nyctaxi.trips
Визуализация счетчиков
Счетчики отображают одно значение в видном виде, с параметром сравнения их с целевым значением. Чтобы использовать счетчики, укажите, какие данные будут отображаться в визуализации счетчиков для столбцов Value и Target . При применении агрегирования в редакторе визуализации нельзя сравнить значения, выбрав номер строки "Значение", как показано в следующем примере. Чтобы сравнить определенные значения строк, используйте набор данных, содержащий все необходимые агрегаты в SQL, который определяет его. Это позволяет выбрать строки целей и значений для их сравнения.
В конфигурации Value можно задать условное форматирование и настроить стиль текста.
Значения конфигурации: для этого примера визуализации счетчика были заданы следующие значения:
- Набор данных: контрпример
- Визуализация: счетчик
- Титул:
Orders: Total price by date (previous two days)
- Значение:
- Поле:
total price
- Номер строки значения: 1
- Поле:
- Цель:
- Поле:
total price
- Номер строки значения: 2
- Поле:
SQL-запрос. Для визуализации этого счетчика для создания набора данных использовался следующий SQL-запрос:
SELECT
SUM(o_totalprice) as `total price`,
o_orderdate
FROM
samples.tpch.orders
GROUP BY o_orderdate
ORDER BY o_orderdate DESC
Визуализация строк
Визуализации строк представляют собой изменение одной или нескольких метрик с течением времени.
Значения конфигурации: для этого примера визуализации строк были заданы следующие значения:
- Набор данных: заказы TPCH
- Визуализация: линия
- Титул:
Average price and order year by order priority and clerk
- Ось абсцисс:
- Поле:
o_orderdate
- Трансформировать:
Yearly
- Тип масштабирования:
Temporal
- Название оси:
Order year
- Поле:
- Ось y:
- Поле:
o_totalprice
- Трансформировать:
Average
- Тип масштабирования:
Quantitative
- Название оси:
Average price
- Поле:
- Группировать по:
- Поле:
o_orderpriority
- Название условных обозначений:
Order priority
- Поле:
- Фильтр
- Поле:
TPCH orders.o_clerk
- Поле:
SQL-запрос. Для визуализации этой визуализации линейчатой диаграммы для создания набора данных с именем TPCH orders
использовался следующий SQL-запрос.
SELECT * FROM samples.tpch.orders
Диаграмма тепловой карты
Диаграммы тепловой карты смешивают функции линейчатых диаграмм, стеков и пузырьковых диаграмм, что позволяет визуализировать числовые данные с помощью цветов. Общая цветовая палитра для тепловой карты показывает самые высокие значения с использованием более теплых цветов, таких как оранжевый или красный, и самые низкие значения с использованием более холодных цветов, таких как синий или фиолетовый.
Например, следующая тепловая карта визуализирует наиболее часто встречающиеся расстояния поездок на такси каждый день и группирует результаты по дням недели, расстоянию и общей стоимости поездки.
Замечание
Тепловая карта может отображать до 64 тысяч строк или 10 МБ.
Значения конфигурации: для визуализации диаграммы тепловой карты были заданы следующие значения:
- Набор данных: заказы TPCH
- Визуализация: тепловая карта
- Столбец X (столбец набора данных):
o_orderpriority
- Столбцы Y (столбец набора данных):
o_orderstatus
- Столбец цвета:
- Столбец набора данных:
o_totalprice
- Тип агрегирования:
Average
- Столбец набора данных:
- Имя оси X (переопределение значения по умолчанию):
Order priority
- Имя оси Y(переопределение значения по умолчанию):
Order status
- Цветовая схема (переопределение значения по умолчанию):
YIGnBu
SQL-запрос. Для визуализации диаграммы тепловой карты для создания набора данных использовался следующий SQL-запрос.
SELECT * FROM samples.tpch.orders
Гистограмма
Гистограмма отображает частоту появления определенного значения в наборе данных. Гистограмма помогает понять, имеет ли набор данных значения, кластеризованные вокруг небольшого количества диапазонов или более распределенные. Гистограмма отображается в виде линейчатой диаграммы, в которой вы управляете количеством разных полос (также называемых ячейками).
Значения конфигурации: для визуализации гистограммы были заданы следующие значения:
- Набор данных: заказы TPCH
- Визуализация: гистограмма
- Столбец X (столбец набора данных):
o_totalprice
- Количество ячеек: 20
- Имя оси X (переопределение значения по умолчанию):
Total price
Параметры конфигурации: для параметров конфигурации гистограммы см. параметры конфигурации гистограммы.
SQL-запрос. Для визуализации диаграммы гистограммы для создания набора данных использовался следующий SQL-запрос.
select * from samples.tpch.orders
Визуализация круговой диаграммы
Визуализации круговой диаграммы показывают пропорциональность между метриками. Они не предназначены для передачи данных временных рядов.
Значения конфигурации: для этого примера визуализации круговой диаграммы были заданы следующие значения:
- Набор данных: заказы TPCH
- Визуализация: визуализация круговой диаграммы
- Титул:
Total price by order priority and clerk
- Угол:
- Поле:
o_totalprice
- Трансформировать:
Sum
- Название оси:
Total price
- Поле:
- Группировать по:
- Поле:
o_orderpriority
- Название условных обозначений:
Order priority
- Поле:
- Фильтр
- Поле:
TPCH orders.o_clerk
- Поле:
SQL-запрос: Для этой круговой диаграммы использовался следующий SQL-запрос для создания набора данных с именем TPCH orders
.
SELECT * FROM samples.tpch.orders
Визуализация сводной таблицы
Сводная визуализация агрегирует записи из результатов запроса в табличный вид. Он похож на PIVOT
инструкции или GROUP BY
инструкции в SQL. Вы настраиваете сводную визуализацию с помощью перетаскивания полей.
Замечание
По соображениям производительности сводные таблицы поддерживают отрисовку только 100 столбцов x 100 строк.
Значения конфигурации: для этого примера визуализации с использованием сводной таблицы были заданы следующие значения:
- Набор данных: TPCH lineitem
- Визуализация: сводная диаграмма
- Титул:
Line item quantity by return flag and ship mode by supplier
- Строки
- Поле:
l_returnflag
- Поле:
- Столбцы:
- Поле:
l_shipmode
- Поле:
- Ячейка
- Набор данных:
- Поле:
l_quantity
- Преобразование: Сумма
- Фильтр
- Поле:
TPCH lineitem.l_supplierkey
- Поле:
SQL-запрос: Для этой сводной визуализации использовался следующий SQL-запрос для создания набора данных с именем TPCH lineitem
.
SELECT * FROM samples.tpch.lineitem
Карта точек
Карты точек отображают количественные данные в виде символов, размещенных в определенных расположениях карты. Маркеры размещаются с помощью координат широты и долготы, которые должны быть включены в результирующий набор для этого типа диаграммы. В следующем примере используются данные из столкновений транспортных средств в Нью-Йорке, штат Нью-Йорк.
Значения конфигурации: для визуализации карты точек были заданы следующие значения:
- Набор данных: Анализ цен на жилье в Сиэтле
- Визуализация: карта точек
- Координаты:
- Широта:
LATITUDE
- Долгота:
LONGITUDE
- Широта:
- Цвет:
- Поле:
avg(bedrooms)
- Тип масштабирования: категориальный
- Поле:
- Размер:
- Поле:
avg(price)
- Поле:
Замечание
Наборы данных Databricks не включают данные широты или долготы, поэтому пример SQL-запроса не указан для этого примера.
Схема Sankey
Схема sankey визуализирует поток из одного набора значений в другой.
Значения конфигурации: для этой схемы sankey были заданы следующие значения:
- Набор данных: пример Sankey
- Визуализация: Sankey
- Этапы
stage1
stage2
- Ценность
- СУММ(value)
SQL-запрос. Для этой визуализации Sankey для создания набора данных использовался следующий SQL-запрос.
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
Точечная визуализация
Точечные визуализации обычно используются для отображения связи между двумя числовыми переменными. Можно закодировать третье измерение цветом, чтобы показать, как числовые переменные отличаются между группами.
Значения конфигурации: для этого примера диаграммы рассеяния были заданы следующие значения:
- Набор данных: TPCH lineitem
- Визуализация: диаграмма рассеяния
- Титул:
Total price and quantity by ship mode and supplier
- Ось абсцисс:
- Поле:
l_quantity
- Название оси:
Quantity
- Тип масштабирования:
Quantitative
- Трансформировать:
None
- Поле:
- Ось y:
- Поле:
l_extendedprice
- Тип масштабирования:
Quantitative
- Трансформировать:
None
- Название оси:
Price
- Поле:
- Группировать по:
- Поле:
l_shipmode
- Название условных обозначений:
Ship mode
- Поле:
- Фильтр
- Поле:
TPCH lineitem.l_supplierkey
- Поле:
SQL-запрос: Для этой визуализации использовался следующий SQL-запрос для создания набора данных с именем TPCH lineitem
.
SELECT * FROM samples.tpch.lineitem
Визуализация таблиц
Визуализация таблицы показывает данные в стандартной таблице, но позволяет вручную переупорядочение, скрытие и форматирование данных.
Замечание
Таблицы могут отображать до 64 КБ строк или 10 МБ.
Значения конфигурации: для этого примера визуализации таблицы были заданы следующие значения:
- Набор данных: TPCH lineitem
- Визуализация: таблица
- Титул:
Line item summary by supplier
- Столбцы:
- Отображение номера строки: включено
- Поле:
l_orderkey
- Поле:
l_extendedprice
- Отображается как:
Number
- Числовой формат (доллары США): $0,00
- Отображается как:
- Поле:
l_discount
- Отображается как:
Number
- Формат чисел: %0.00
- Отображается как:
- Поле:
l_tax
- Отображается как:
Number
- Формат чисел: %0.00
- Отображается как:
- Поле:
l_shipdate
- Поле:
l_shipmode
- Фильтр
- Поле:
TPCH lineitem.l_supplierkey
- Поле:
Параметры конфигурации. Параметры конфигурации визуализации таблиц см. в разделе "Параметры таблицы".
SQL-запрос. Для визуализации этой таблицы для создания набора данных с именем TPCH lineitem
использовался следующий SQL-запрос.
SELECT * FROM samples.tpch.lineitem