Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
На этой странице описаны типы визуализаций, доступные для использования на панелях мониторинга ИИ/BI, и показано, как создать пример каждого типа визуализации. Инструкции по созданию панели мониторинга см. в статье "Создание панели мониторинга". Вы можете использовать естественный язык, чтобы предложить помощнику создать диаграммы с полосами, линейные, точечные карты, точечные, круговые и диаграммы счетчика. См. Создание визуализаций с помощником Databricks.
Это важно
На этой странице рассматриваются визуализации панелей мониторинга ИИ/BI. Для визуализации в записных книжках Azure Databricks и редакторе SQL см. раздел "Типы визуализаций в записных книжках и в редакторе SQL".
Сведения об ограничениях отрисовки визуализации см. в разделе «Ограничения дашборда».
Визуализация областей
Визуализации областей объединяют визуализации линий и линейчатой диаграммы, чтобы показать, как числовые значения одной или нескольких групп изменяются при прогрессии второй переменной, как правило, времени. Эти диаграммы часто используются, чтобы показать изменений воронки продаж с течением времени.
Чтобы изменить макет, выполните следующие действия.
- Щелкните
в секции Y-оси панели редактирования.
- В разделе "Макет" выберите Stack или 100% Stack.
Значения конфигурации: для предоставленного примера визуализации области были заданы следующие значения:
- Набор данных: samples.tpch.orders
- Визуализация: область
- Титул:
Total price and order year by order priority and clerk - Ось абсцисс:
- Поле:
o_orderdate - Трансформировать:
Yearly - Тип масштабирования:
Continuous - Название оси:
Order year
- Поле:
- Ось y:
- Поле:
o_totalprice - Название оси:
Total price - Тип масштабирования:
Continuous - Трансформировать:
Sum
- Поле:
- Цвет:
- Поле:
o_orderpriority - Название условных обозначений:
Order priority
- Поле:
- Фильтр
- Поле:
TPCH orders.o_clerk
- Поле:
SQL-запрос. Для визуализации этой области используется следующий SQL-запрос для создания набора данных с именем TPCH orders.
SELECT * FROM samples.tpch.orders;
Столбчатая диаграмма
Линейчатые диаграммы представляют изменение метрик с течением времени или между категориями и показывают пропорциональность, аналогичную визуализации круговой диаграммы.
Чтобы изменить макет, выполните следующие действия.
- Щелкните
в секции Y-оси панели редактирования.
- В разделе "Макет" выберите Stack или 100% Stack или Group.
Значения конфигурации: для предоставленного примера линейчатой диаграммы были заданы следующие значения:
- Набор данных: samples.tpch.orders
- Визуализация: панель
- Титул:
Total price and order month by order priority and clerk - Ось абсцисс:
- Поле:
o_orderdate - Трансформировать:
Monthly - Тип масштабирования:
Continuous - Название оси:
Order month
- Поле:
- Ось y:
- Поле:
o_totalprice - Тип масштабирования:
Continuous - Трансформировать:
Sum - Название оси:
Total price
- Поле:
- Цвет:
- Поле:
o_orderpriority - Название условных обозначений:
Order priority
- Поле:
- Фильтр
- Поле:
TPCH orders.o_clerk
- Поле:
SQL-запрос: следующий SQL-запрос создал набор TPCH orders данных для этой визуализации панели.
SELECT * FROM samples.tpch.orders;
Ящиковая диаграмма
Визуализация прямоугольной диаграммы показывает сводку распределения числовых данных, при необходимости сгруппированную по категориям. С помощью визуализации диаграммы можно быстро сравнить диапазоны значений между категориями и визуализировать локальность, распространение и отклонение групп значений через их квартиль. В каждом поле темная линия показывает межквартильный диапазон. Дополнительные сведения об интерпретации ящичных графиков см. в статье «Диаграмма размаха» на Википедии.
Для предоставленного примера прямоугольной диаграммы были заданы следующие значения:
- Столбец X (столбец набора данных):
l-returnflag - Столбцы Y (столбец набора данных):
l_extendedprice - Заголовок оси X:
Return flag1 - Название оси Y:
Extended price
SQL-запрос. Для визуализации этой диаграммы для создания набора данных использовался следующий SQL-запрос.
SELECT * FROM samples.tpch.lineitem;
Пузырьковая диаграмма
Пузырьковые диаграммы — это точечные диаграммы, где размер каждого маркера точек отражает соответствующую метрику. Чтобы сделать пузырьковую диаграмму, выберите "Точечная " в качестве типа визуализации. В параметре "Размер" выберите нужную метрику, представленную размером маркеров.
Значения конфигурации: для предоставленного примера пузырьковой диаграммы были заданы следующие значения:
- Набор данных: поездки на такси Нью-Йорка
- Визуализация: диаграмма рассеяния
- Титул:
Trip distance, fares, and trip duration - Ось абсцисс:
- Поле:
trip_distance - Тип масштабирования:
Continuous - Трансформировать:
None
- Поле:
- Ось y:
- Поле:
fare_amount - Тип масштабирования:
Continuous - Трансформировать:
None
- Поле:
- Цвет по:
- Поле:
pickup_zip
- Поле:
- Размер:
- Поле:
minutes_in_taxi - Трансформировать:
None
- Поле:
SQL-запрос. Для визуализации пузырьковой диаграммы для создания набора данных использовался следующий SQL-запрос.
SELECT
*,
TIMESTAMPDIFF(MINUTE, tpep_pickup_datetime, tpep_dropoff_datetime) AS minutes_in_taxi
FROM samples.nyctaxi.trips
LIMIT 500;
Карта Хороплет
В хороплетных визуализациях географические области, такие как страны или штаты, окрашиваются в соответствии с суммарными значениями каждого ключевого столбца. Запрос должен возвращать географические объекты по имени. Пользователи могут создавать карты, отображающие административные границы на уровне страны, штата или провинции, а также округа или района.
Значения конфигурации: для этой хороплетной визуализации были заданы следующие значения:
- Набор данных: samples.tpch.customer
- Страна:
Country - Цвет: sum(c_acct_bal)
SQL-запрос. Для этой визуализации хороплей для создания набора данных использовался следующий SQL-запрос.
SELECT
INITCAP(n_name) AS Country,
SUM(c_acctbal)
FROM samples.tpch.customer
JOIN samples.tpch.nation WHERE n_nationkey = c_nationkey
GROUP BY 1;
Когортная диаграмма
С помощью группирования пользователей на основе общей характеристики (например, даты регистрации) и отслеживания их активности в последующие периоды времени можно визуализировать шаблоны хранения и поведения пользователей. Эта визуализация помогает понять, как различные когорты пользователей взаимодействуют с вашим продуктом или службой с течением времени.
Чтобы создать когортную диаграмму, используйте визуализацию сводных данных хранения. В следующем примере отслеживается удержание клиентов, вычисляя, когда клиенты впервые размещают заказ (дату их когорты), и измеряется, сколько клиентов из каждой когорты остаются активными в последующие годы. Цветовая шкала указывает коэффициенты удержания, где более тёмные цвета показывают более высокий уровень удержания.
Значения конфигурации: для этого примера когортной диаграммы были заданы следующие значения:
- Набор данных: samples.tpch.orders
- Визуализация: сводная диаграмма
- Титул:
Customer retention by cohort year - Строки
- Поле:
Cohort - Трансформировать:
Yearly
- Поле:
- Столбцы:
- Поле:
Active Period
- Поле:
- Ячейка:
- Поле:
Retention - Стиль:
Color Scale
- Поле:
SQL-запрос. Для визуализации этой когортной диаграммы для создания набора Orders cohort analysisданных использовался следующий SQL-запрос.
-- get the list of customers and when they were active
WITH history AS (
SELECT o_orderdate, o_custkey -- replace with the right columns representing date and id
FROM samples.tpch.orders -- replace with desired table
GROUP BY ALL
),
-- find the date of the first order for each customer
cohort AS (
SELECT o_custkey, MIN(o_orderdate) AS first_date
FROM history
GROUP BY 1
),
-- combine the customer activity table with the date of first activity, and choose a granularity (e.g. YEAR)
joined AS (
SELECT
DATE_TRUNC("YEAR", first_date) AS cohort,
CAST(DATE_DIFF(YEAR, cohort, o_orderdate) AS STRING) AS active,
o_custkey
FROM history LEFT JOIN cohort USING(o_custkey)
),
-- calculate the number of distinct customers by cohort and date active
grouped AS (
SELECT cohort, active, COUNT(DISTINCT o_custkey) AS customers
FROM joined
GROUP BY 1, 2
),
-- calculate the number of initial customers for each cohort
initial_customers AS (
SELECT cohort, customers AS t0_customers
FROM grouped
WHERE active = 0
)
-- calculate the retention by cohort and date active
SELECT
cohort AS Cohort,
active AS Active,
CASE WHEN active = 1 THEN CONCAT(active, " year")
ELSE CONCAT(active, " years") END AS `Active Period`,
customers AS Customers,
t0_customers AS `Initial Customers`,
TRY_DIVIDE(customers, t0_customers) AS Retention
FROM grouped LEFT JOIN initial_customers USING (cohort)
WHERE active > 0;
Диаграмма со списком
Комбо-диаграммы объединяют линии и линейчатые диаграммы, чтобы представить изменения с течением времени с пропорциональностью.
Значения конфигурации: для этой визуализации комбинированной диаграммы были заданы следующие значения:
- Набор данных: samples.tpch.partsupp
- Визуализация: комбо
- Ось абсцисс:
ps_partkey- Тип масштабирования:
Continuous
- Тип масштабирования:
- Ось y:
- Бар:
ps_availqty - Тип агрегирования:
SUM - Линия:
ps_supplycost - Тип агрегирования:
AVG
- Бар:
- Цвет по серии Y:
Sum of ps_availqtyAverage ps_supplycost
SQL-запрос: Для этой визуализации составной диаграммы использовался следующий SQL-запрос для создания набора данных.
SELECT * FROM samples.tpch.partsupp;
Комбинированная диаграмма с двумя осями
Для отображения двух разных осей Y можно использовать комбинированные диаграммы. Выбрав мини-приложение комбинированной диаграммы, щелкните значок меню "Kebab" на параметрах оси Y в панели конфигурации диаграммы. Включите параметр "Включить двойную ось ".
Значения конфигурации: для этой смешанной диаграммы опция Двойная ось включена. Другие конфигурации задаются следующим образом:
- Набор данных: samples.nyctaxi.trips
- Визуализация: комбо
- Ось абсцисс:
tpep_pickup_datetime- Трансформировать:
Weekly - Тип масштабирования:
Continuous
- Трансформировать:
- Ось y:
- Левая ось Y (полоса):
trip_distance- Трансформировать:
AVG
- Трансформировать:
- Правая ось Y (линия):
fare_amount- Трансформировать:
AVG
- Трансформировать:
- Левая ось Y (полоса):
Цвет по серии Y:
Average trip_distanceAverage fare_amount
SQL-запрос: следующий SQL-запрос использовался для создания набора данных:
SELECT * FROM samples.nyctaxi.trips;
Визуализация счетчиков
Счетчики наглядно отображают одно значение, с возможностью сравнения его со значением смещения. Чтобы использовать счетчики, укажите, какие данные будут отображаться в визуализации счетчиков для столбцов "Значение и сравнение ". При необходимости выберите столбец даты и агрегирование, чтобы отобразить спарклайн на диаграмме.
В конфигурации Value можно задать условное форматирование и настроить стиль текста.
Значения конфигурации: для этого примера визуализации счетчика были заданы следующие значения:
- Набор данных:
samples.tpch.orders - Визуализация: счетчик
- Титул:
Orders: Total price by date (compared to the previous day) - Значение:
- Дата:
DAILY(o_orderdate) - Значение:
total price
- Дата:
- Сравнение:
- Поле:
o_orderdate - Смещение дней назад: -1
- Поле:
SQL-запрос. Для визуализации этого счетчика для создания набора данных использовался следующий SQL-запрос:
SELECT
SUM(o_totalprice) AS `total price`,
o_orderdate
FROM
samples.tpch.orders
GROUP BY o_orderdate
ORDER BY o_orderdate DESC;
Воронковая диаграмма
Воронковая диаграмма помогает анализировать изменение метрик на разных этапах. Чтобы использовать воронку, укажите столбцы step и value.
Например, на следующей воронковой диаграмме показано, как пользователи проходят этапы потока регистрации. Каждый этап представляет собой шаг процесса с его размером, отражающим количество пользователей, которые достигли этого шага.
Значения конфигурации: для этой воронковой диаграммы были заданы следующие значения:
- Набор данных: этапы воронки взаимодействия пользователей
- Визуализация: Воронка
- Ось X:
stage - Ось Y:
count- Тип агрегирования:
SUM
- Тип агрегирования:
- Столбец цвета:
- Столбец набора данных:
count
- Столбец набора данных:
SQL-запрос: Следующий SQL-запрос создал набор данных для этой визуализации диаграммы воронки.
SELECT *
FROM VALUES
('Visited Website', 10000),
('Signed Up', 4000),
('Activated Account', 2500),
('Added First Item', 1500),
('Completed Purchase', 800)
AS funnel(stage, count);
Диаграмма тепловой карты
Диаграммы тепловой карты смешивают функции линейчатых диаграмм, сложенных диаграмм и пузырьковых диаграмм, что позволяет визуализировать числовые данные с помощью цветов.
Например, следующая тепловая карта визуализирует количество заказов на основе их приоритета и метода доставки. Ось x представляет приоритеты заказов, а ось y - разные методы доставки. Интенсивность цвета указывает сумму счетчиков заказов, при этом легенда показывает шкалу количества заказов.
Замечание
Тепловая карта может отображать до 64 тысяч строк или 10 МБ.
Значения конфигурации: для визуализации диаграммы тепловой карты были заданы следующие значения:
- Набор данных: samples.tpch.orders
- Визуализация: тепловая карта
- Ось X:
priority - Ось Y:
ship_mode - Столбец цвета:
- Столбец набора данных:
order_count - Тип агрегирования:
SUM
- Столбец набора данных:
- Имя оси X (переопределение значения по умолчанию):
Order Priority - Имя оси Y(переопределение значения по умолчанию):
Shipping method - Цветная рампа:
Green Blue
SQL-запрос. Для визуализации диаграммы тепловой карты для создания набора данных использовался следующий SQL-запрос.
SELECT
o.o_orderpriority AS priority,
l.l_shipmode AS ship_mode,
COUNT(*) AS order_count,
o.o_orderdate
FROM
samples.tpch.orders AS o
JOIN
samples.tpch.lineitem AS l
ON
o.o_orderkey = l.l_orderkey
GROUP BY
o.o_orderpriority,
l.l_shipmode,
o.o_orderdate
ORDER BY
priority,
ship_mode;
Гистограмма
Гистограмма отображает частоту появления определенного значения в наборе данных. Гистограмма помогает понять, имеет ли набор данных значения, кластеризованные вокруг небольшого количества диапазонов или более распределенные. Гистограмма отображается в виде линейчатой диаграммы, в которой вы управляете количеством разных полос (также называемых ячейками).
Значения конфигурации: для визуализации гистограммы были заданы следующие значения:
- Набор данных: samples.tpch.orders
- Визуализация: гистограмма
- Столбец X (столбец набора данных):
o_totalprice - Количество ячеек: 20
- Имя оси X (переопределение значения по умолчанию):
Total price
Параметры конфигурации: для параметров конфигурации гистограммы см. параметры конфигурации гистограммы.
SQL-запрос. Для визуализации диаграммы гистограммы для создания набора данных использовался следующий SQL-запрос.
SELECT * FROM samples.tpch.orders;
Визуализация строк
Визуализации строк представляют собой изменение одной или нескольких метрик с течением времени.
Значения конфигурации: для этого примера визуализации строк были заданы следующие значения:
- Набор данных: samples.tpch.orders
- Визуализация: линия
- Титул:
Average price and order year by order priority and clerk - Ось абсцисс:
- Поле:
o_orderdate - Трансформировать:
Yearly - Тип масштабирования:
Continuous - Название оси:
Order year
- Поле:
- Ось y:
- Поле:
o_totalprice - Трансформировать:
Average - Тип масштабирования:
Continuous - Название оси:
Average price
- Поле:
- Цвет:
- Поле:
o_orderpriority - Название условных обозначений:
Order priority
- Поле:
SQL-запрос: для этой визуализации линейной диаграммы использовался следующий SQL-запрос для создания набора данных с именем Orders data.
SELECT * FROM samples.tpch.orders;
Визуализация круговой диаграммы
Визуализации круговой диаграммы показывают пропорциональность между метриками. Они не предназначены для передачи данных временных рядов.
Значения конфигурации: для этого примера визуализации круговой диаграммы были заданы следующие значения:
- Набор данных: samples.tpch.orders
- Визуализация: визуализация круговой диаграммы
- Титул:
Total price by order priority and clerk - Угол:
- Поле:
o_totalprice - Трансформировать:
Sum - Название оси:
Total price
- Поле:
- Цвет:
- Поле:
o_orderpriority - Название условных обозначений:
Order priority
- Поле:
- Фильтр
- Поле:
TPCH orders.o_clerk
- Поле:
SQL-запрос: Для этой круговой диаграммы использовался следующий SQL-запрос для создания набора данных с именем TPCH orders.
SELECT * FROM samples.tpch.orders;
Визуализация сводной таблицы
Сводная визуализация агрегирует записи из результатов запроса в табличный вид. Он похож на PIVOT инструкции или GROUP BY инструкции в SQL. Вы настраиваете сводную визуализацию с помощью перетаскивания полей.
Подробные сведения о параметрах конфигурации таблицы сводной таблицы, включая колонтитулы, условное форматирование и добавление ссылок, см. в разделе конфигурации таблицы сводной таблицы.
Значения конфигурации: для этого примера визуализации с использованием сводной таблицы были заданы следующие значения:
- Набор данных: samples.tpch.lineitem
- Визуализация: сводная диаграмма
- Титул:
Line item quantity by return flag and ship mode by supplier - Строки
- Поле:
l_returnflag - Итог отображения: установлен
- Поле:
- Столбцы:
- Поле:
l_shipmode - Общий итог: отмечено
- Поле:
- Значения
- Поле:
l_quantity - Преобразование: Сумма
- Поле:
SQL-запрос: Для этой сводной визуализации использовался следующий SQL-запрос для создания набора данных с именем TPCH lineitem.
SELECT * FROM samples.tpch.lineitem;
Карта точек
Карты точек отображают количественные данные в виде символов, размещенных в определенных расположениях карты. Маркеры размещаются с помощью координат широты и долготы, которые должны быть включены в результирующий набор для этого типа диаграммы. В следующем примере используются данные из столкновений транспортных средств в Нью-Йорке, штат Нью-Йорк.
Значения конфигурации: для визуализации карты точек были заданы следующие значения:
- Набор данных: Анализ цен на жилье в Сиэтле
- Визуализация: карта точек
- Координаты:
- Широта:
LATITUDE - Долгота:
LONGITUDE
- Широта:
- Цвет:
- Поле:
avg(bedrooms)- Тип масштабирования: категориальный
- Поле:
- Размер:
- Поле:
avg(price)
- Поле:
Замечание
Наборы данных Databricks не включают данные широты или долготы, поэтому пример SQL-запроса не указан для этого примера.
Схема Sankey
Схема sankey визуализирует поток из одного набора значений в другой.
Значения конфигурации: для этой схемы sankey были заданы следующие значения:
- Набор данных: samples.nyctaxi.trips
- Визуализация: Sankey
- Этапы
stage1stage2
- Ценность
- СУММ(value)
SQL-запрос. Для этой визуализации Sankey для создания набора данных использовался следующий SQL-запрос.
SELECT pickup_zip AS stage1, dropoff_zip AS stage2, SUM(fare_amount) AS value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10;
Точечная визуализация
Точечные визуализации обычно используются для отображения связи между двумя числовыми переменными. Можно закодировать третье измерение цветом, чтобы показать, как числовые переменные отличаются между группами.
Значения конфигурации: для этого примера диаграммы рассеяния были заданы следующие значения:
- Набор данных: samples.tpch.lineitem
- Визуализация: диаграмма рассеяния
- Титул:
Total price and quantity by ship mode and supplier - Ось абсцисс:
- Поле:
l_quantity - Название оси:
Quantity - Тип масштабирования:
Continuous - Трансформировать:
None
- Поле:
- Ось y:
- Поле:
l_extendedprice - Тип масштабирования:
Continuous - Трансформировать:
None - Название оси:
Price
- Поле:
- Цвет:
- Поле:
l_shipmode - Название условных обозначений:
Ship mode
- Поле:
- Фильтр
- Поле:
TPCH lineitem.l_supplierkey
- Поле:
SQL-запрос: Для этой визуализации использовался следующий SQL-запрос для создания набора данных с именем TPCH lineitem.
SELECT * FROM samples.tpch.lineitem
Визуализация таблиц
Визуализация таблицы показывает данные в стандартной таблице, но позволяет вручную переупорядочение, скрытие и форматирование данных.
Замечание
Таблицы могут отображать до 64 КБ строк или 10 МБ.
Значения конфигурации: для этого примера визуализации таблицы были заданы следующие значения:
- Набор данных: samples.tpch.lineitem
- Визуализация: таблица
- Титул:
Line item summary by supplier - Столбцы:
- Отображение номера строки: включено
- Поле:
l_orderkey - Поле:
l_extendedprice- Отображается как:
Number - Числовой формат (доллары США): $0,00
- Отображается как:
- Поле:
l_discount- Отображается как:
Number - Формат чисел: %0.00
- Отображается как:
- Поле:
l_tax- Отображается как:
Number - Формат чисел: %0.00
- Отображается как:
- Поле:
l_shipdate - Поле:
l_shipmode
- Фильтр
- Поле:
TPCH lineitem.l_supplierkey
- Поле:
Параметры конфигурации. Параметры конфигурации визуализации таблиц см. в разделе "Параметры таблицы".
SQL-запрос. Для визуализации этой таблицы для создания набора данных с именем TPCH lineitemиспользовался следующий SQL-запрос.
SELECT * FROM samples.tpch.lineitem
Каскадная диаграмма
Каскадные диаграммы отображают совокупный эффект последовательных положительных и отрицательных значений, показывающий, как начальное значение влияет на ряд промежуточных положительных и отрицательных значений. Они обычно используются для визуализации финансовых данных, таких как прибыль и потери, или для демонстрации того, как различные факторы способствуют общему изменению.
Значения конфигурации: в этом примере каскадной диаграммы были заданы следующие значения:
- Набор данных: создан по запросу
- Визуализация: водопадный график
- Ось X: ЕЖЕМЕСЯЧНО(date_col)
- Ось Y: SUM(amount)
SQL-запрос. Для этой визуализации таблицы для создания набора данных использовался следующий SQL-запрос.
with base as (
SELECT
*
FROM
VALUES
(2535, '2025-01-01'),
(-853, '2025-02-01'),
(3229, '2025-03-01'),
(1820, '2025-04-01'),
(3195, '2025-05-01'),
(-1800, '2025-06-01'),
(-562, '2025-07-01'),
(-332, '2025-08-01'),
(1750, '2025-09-01'),
(-330, '2025-10-01'),
(3300, '2025-11-01'),
(4400, '2025-12-01') AS t (amount, date_str)
)
SELECT
amount,
cast(date_str as date) as date_col
from
base