視覺效果類型
本文概述可用於 Azure Databricks 筆記本和 Databricks SQL 中的視覺效果類型,並示範如何建立每個視覺效果類型的範例。
橫條圖
橫條圖代表一段時間的計量變更,或顯示比例,類似于 餅 圖。
注意
橫條圖支援後端匯總,支援傳回超過 64K 個數據列的查詢,而不需要截斷結果集。
組態值 :針對此橫條圖視覺效果,已設定下列值:
- X 欄:
- 資料集資料行:
o_orderdate
- 日期層級:
Months
- 資料集資料行:
- Y 資料行:
- 資料集資料行:
o_totalprice
- 匯總類型:
Sum
- 資料集資料行:
- 分組依據 (資料集資料行):
o_orderpriority
- 疊加:
Stack
- X 軸名稱(覆寫預設值):
Order month
- Y 軸名稱 (覆寫預設值):
Total price
組態選項 :如需橫條圖組態選項,請參閱 圖表組態選項 。
SQL 查詢 :針對此橫條圖視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.orders
折線圖
折線圖在一段時間內呈現一或多個計量的變更。
注意
折線圖支援後端匯總,支援傳回超過 64K 個數據列的查詢,而不會截斷結果集。
組態值 :針對此折線圖視覺效果,已設定下列值:
- X 欄:
- 資料集資料行:
o_orderdate
- 日期層級:
Years
- 資料集資料行:
- Y 資料行:
- 資料集資料行:
o_totalprice
- 匯總類型:
Average
- 資料集資料行:
- 分組依據 (資料集資料行):
o_orderpriority
- X 軸名稱(覆寫預設值):
Order year
- Y 軸名稱 (覆寫預設值):
Average price
組態選項 :如需折線圖組態選項,請參閱 圖表組態選項 。
SQL 查詢 :針對此折線圖視覺效果,會使用下列 SQL 查詢來產生資料集。
select * from samples.tpch.orders
區域圖
區域圖結合了折線圖和橫條圖,以顯示一或多個群組的數值如何隨著第二個變數的進展而改變,通常是時間。 它們通常用來顯示銷售漏斗圖隨時間變更。
注意
區域圖支援後端匯總,支援傳回超過 64K 個數據列的查詢,而不需要截斷結果集。
組態值 :針對此區域圖視覺效果,已設定下列值:
- X 欄:
- 資料集資料行:
o_orderdate
- 日期層級:
Years
- 資料集資料行:
- Y 資料行:
- 資料集資料行:
o_totalprice
- 匯總類型:
Sum
- 資料集資料行:
- 分組依據 (資料集資料行):
o_orderpriority
- 疊加:
Stack
- X 軸名稱(覆寫預設值):
Order year
- Y 軸名稱 (覆寫預設值):
Total price
組態選項 :如需區域圖組態選項,請參閱 圖表組態選項 。
SQL 查詢 :針對此區域圖視覺效果,會使用下列 SQL 查詢來產生資料集。
select * from samples.tpch.orders
圓形圖
圓形圖會顯示計量之間的比例。 它們並非 用來傳達時間序列資料。
注意
圓形圖支援後端匯總,支援傳回超過 64K 個數據列的查詢,而不需要截斷結果集。
組態值 :針對此圓形圖視覺效果,已設定下列值:
- X 資料行(資料集資料行):
o_orderpriority
- Y 資料行:
- 資料集資料行:
o_totalprice
- 匯總類型:
Sum
- 資料集資料行:
- 標籤 (覆寫預設值):
Total price
組態選項 :如需圓形圖組態選項,請參閱 圖表組態選項 。
SQL 查詢 :針對此圓形圖視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.orders
長條圖圖表
長條圖繪製給定值在資料集中發生的頻率。 長條圖可協助您瞭解資料集的值是叢集在少數範圍周圍,還是散佈得更多。長條圖會顯示為橫條圖,您可以在其中控制相異橫條的數目(也稱為 bins)。
注意
長條圖圖表支援後端匯總,可支援傳回超過 64K 個數據列的查詢,而不需要截斷結果集。
組態值 :針對此長條圖圖表視覺效果,已設定下列值:
- X 資料行(資料集資料行):
o_totalprice
- 量化數目:20
- X 軸名稱(覆寫預設值):
Total price
組態選項 :如需長條圖組態選項,請參閱 長條圖設定選項 。
SQL 查詢 :針對此長條圖視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.orders
熱度圖圖表
熱度圖圖表混合橫條圖、堆疊圖和泡泡圖的功能,可讓您使用色彩將數值資料視覺化。 熱度圖的常見調色盤會顯示使用較暖色彩的最高值,例如橙色或紅色,以及使用較酷色彩的最低值,例如藍色或紫色。
例如,請考慮下列熱度圖,將每天最頻繁發生的計程車車程距離視覺化,並將結果依周幾、距離和總車資分組。
注意
熱度圖圖表支援後端匯總,支援傳回超過 64K 個數據列的查詢,而不會截斷結果集。
組態值 :針對此熱度圖圖表視覺效果,已設定下列值:
- X 資料行(資料集資料行):
o_orderpriority
- Y 資料行 (資料集資料行):
o_orderstatus
- 色彩資料行:
- 資料集資料行:
o_totalprice
- 匯總類型:
Average
- 資料集資料行:
- X 軸名稱(覆寫預設值):
Order priority
- Y 軸名稱(覆寫預設值):
Order status
- 色彩配置(覆寫預設值):
YIGnBu
組態選項 :如需熱度圖組態選項,請參閱 熱度圖圖表組態選項 。
SQL 查詢 :針對此熱度圖圖表視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.orders
散佈圖
散佈圖視覺效果通常用於顯示兩個數值變數之間的關聯性。 此外,可以使用色彩來編碼第三個維度,以顯示數值變數在群組之間如何不同。
注意
散佈圖支援後端匯總,支援傳回超過 64K 個數據列的查詢,而不需要截斷結果集。
組態值 :針對此散佈圖視覺效果,已設定下列值:
- X 資料行(資料集資料行):
l_quantity
- Y 資料行(資料集資料行):
l_extendedprice
- 分組依據 (資料集資料行):
l_returnflag
- X 軸名稱(覆寫預設值):
Quantity
- Y 軸名稱 (覆寫預設值):
Extended price
組態選項 :如需散佈圖組態選項,請參閱 圖表組態選項 。
SQL 查詢 :針對此散佈圖視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.lineitem
泡泡圖
泡泡圖是散佈圖,其中每個點標記的大小都會反映相關的計量。
注意
泡泡圖支援後端匯總,支援傳回超過 64K 個數據列的查詢,而不需要截斷結果集。
組態值 :針對這個泡泡圖視覺效果,已設定下列值:
- X (資料集資料行):
l_quantity
- Y 資料行 (資料集資料行):
l_extendedprice
- 分組依據 (資料集資料行):
l-returnflag
- 泡泡大小資料行 (資料集資料行):
l_tax
- 泡泡大小係數:20
- X 軸名稱(覆寫預設值):
Quantity
- Y 軸名稱 (覆寫預設值):
Extended price
組態選項 :如需泡泡圖組態選項,請參閱 圖表組態選項 。
SQL 查詢 :針對這個泡泡圖視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.lineitem
方塊圖
方塊圖視覺效果會顯示數值資料的分佈摘要,並選擇性地依類別分組。 使用方塊圖表視覺效果,您可以快速比較類別之間的值範圍,並透過四分位數將值的區域、散佈和扭曲群組視覺化。 在每個方塊中,較深的線條會顯示四分之一範圍。 如需解譯方塊圖視覺效果的詳細資訊,請參閱 Wikipedia 上的 Box 圖表文章 。
注意
Box charts 只支援最多 64,000 個數據列的匯總。 如果資料集大於 64,000 個數據列,則會截斷資料。
組態值 :針對此方塊圖表視覺效果,已設定下列值:
- X 資料行(資料集資料行):
l-returnflag
- Y 資料行 (資料集資料行):
l_extendedprice
- 分組依據 (資料集資料行):
l_shipmode
- X 軸名稱(覆寫預設值):
Return flag1
- Y 軸名稱 (覆寫預設值):
Extended price
組態選項 :如需方塊圖組態選項,請參閱 Box chart configuation 選項 。
SQL 查詢 :針對此方塊圖表視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.lineitem
組合圖
組合圖結合 折線 圖和 條形 圖,以比例呈現一段時間的變更。
注意
組合圖支援後端匯總,可支援傳回超過 64K 個數據列的查詢,而不需要截斷結果集。
組態值 :針對此組合圖視覺效果,已設定下列值:
- X 資料行(資料集資料行):
l_shipdate
- Y 資料行:
- 第一個資料集資料行:
l_extendedprice
- 匯總類型:平均
- 第二個資料集資料行:
l_quantity
- 匯總類型:平均
- 第一個資料集資料行:
- X 軸名稱(覆寫預設值):
Ship date
- 左 Y 軸名稱 (覆寫預設值):
Quantity
- 右 Y 軸名稱 (覆寫預設值):
Average price
- 系列:
- Order1 (資料集資料行):
AVG(l_extendedprice)
- Y 軸:右
- 類型:線條
- Order2 (資料集資料行):
AVG(l_quantity)
- Y 軸:左
- 類型:列
- Order1 (資料集資料行):
組態選項 :如需組合圖組態選項,請參閱 圖表組態選項 。
SQL 查詢 :針對此組合圖視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.lineitem
世代分析
世代分析會檢查預先決定群組的結果,稱為世代,因為它們會經過一組階段。 世代視覺效果只會匯總日期 (它允許每月匯總)。 它不會在結果集中執行任何其他資料匯總。 所有其他匯總都會在查詢本身內完成。
組態值 :針對此世代視覺效果,已設定下列值:
- 日期(貯體)(資料庫資料行):
cohort_month
- 階段 (資料庫資料行):
months
- 貯體母體擴展大小 (資料庫資料行):
size
- 階段值 (資料庫資料行):
active
- 時間間隔:
monthly
組態選項 :如需世代組態選項,請參閱 世代圖表組態選項 。
SQL 查詢 :針對此世代視覺效果,下列 SQL 查詢可用來產生資料集。
-- match each customer with its cohort by month
with cohort_dates as (
SELECT o_custkey, min(date_trunc('month', o_orderdate)) as cohort_month
FROM samples.tpch.orders
GROUP BY 1
),
-- find the size of each cohort
cohort_size as (
SELECT cohort_month, count(distinct o_custkey) as size
FROM cohort_dates
GROUP BY 1
)
-- for each cohort and month thereafter, find the number of active customers
SELECT
cohort_dates.cohort_month,
ceil(months_between(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month)) as months,
count(distinct samples.tpch.orders.o_custkey) as active,
first(size) as size
FROM samples.tpch.orders
left join cohort_dates on samples.tpch.orders.o_custkey = cohort_dates.o_custkey
left join cohort_size on cohort_dates.cohort_month = cohort_size.cohort_month
WHERE datediff(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month) != 0
GROUP BY 1, 2
ORDER BY 1, 2
計數器顯示
計數器會以醒目方式顯示單一值,並可選擇將它們與目標值進行比較。 若要使用計數器,請指定要在值 資料行和 目標 資料行的 計數器視覺效果上顯示的資料列。
注意
計數器僅支援最多 64,000 個數據列的匯總。 如果資料集大於 64,000 個數據列,則會截斷資料。
組態值 :針對此計數器視覺效果,已設定下列值:
- 值資料行
- 資料集資料行:
avg(o_totalprice)
- 列:1
- 資料集資料行:
- 目標資料行:
- 資料集資料行:
avg(o_totalprice)
- 列:2
- 資料集資料行:
- 格式化目標值:啟用
SQL 查詢 :針對此計數器視覺效果,會使用下列 SQL 查詢來產生資料集。
select o_orderdate, avg(o_totalprice)
from samples.tpch.orders
GROUP BY 1
ORDER BY 1 DESC
漏斗圖視覺效果
漏斗圖視覺效果可協助分析不同階段計量中的變更。 若要使用漏斗圖,請指定 step
和 資料行 value
。
注意
漏斗圖僅支援最多 64,000 個數據列的匯總。 如果資料集大於 64,000 個數據列,則會截斷資料。
組態值 :針對此漏斗圖視覺效果,已設定下列值:
- 步驟資料行 (資料集資料行):
o_orderstatus
- 值資料行(資料集資料行):
Revenue
SQL 查詢 :針對此漏斗圖視覺效果,下列 SQL 查詢可用來產生資料集。
SELECT o_orderstatus, sum(o_totalprice) as Revenue
FROM samples.tpch.orders
GROUP BY 1
Choropleth 地圖視覺效果
在合流視覺效果中,地理區域,例如國家/地區或州,會根據每個索引鍵資料行的匯總值來著色。 查詢必須依名稱傳回地理位置。
注意
Choropleth 視覺效果不會在結果集中執行任何資料匯總。 所有匯總都必須在查詢本身內計算。
組態值 :針對此合流視覺效果,已設定下列值:
- 地圖 (資料集資料行):
Countries
- 地理資料行(資料集資料行):
Nation
- 地理類型:簡短名稱
- 值資料行(資料集資料行):
revenue
- 叢集模式:等價
組態選項 :如需 choropleth 組態選項,請參閱 choropleth configuation 選項 。
SQL 查詢 :針對此 choropleth 視覺效果,下列 SQL 查詢可用來產生資料集。
SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1
標記地圖視覺效果
在標記視覺效果中,標記會放置在地圖上的一組座標。 查詢結果必須傳回緯度和經度組。
注意
標記不會對結果集中的資料進行任何匯總。 所有匯總都必須在查詢本身內計算。
此標記範例是從包含緯度和經度值的資料集產生,這些資料在 Databricks 範例資料集中無法使用。 如需 choropleth 組態選項,請參閱 標記組態選項 。
樞紐分析表視覺效果
樞紐分析表視覺效果會將查詢結果中的記錄匯總成新的表格式顯示。 它類似于 PIVOT
SQL 中的 或 GROUP BY
語句。 您可以使用拖放欄位來設定樞紐分析表視覺效果。
注意
樞紐分析表支援後端匯總,支援傳回超過 64K 個數據列的查詢,而不需要截斷結果集。 不過,樞紐分析表(舊版)僅支援最多 64,000 個數據列的匯總。 如果資料集大於 64,000 個數據列,則會截斷資料。
組態值 :針對此樞紐分析表視覺效果,已設定下列值:
- 選取資料列 (資料集資料行):
l_retkurnflag
- 選取資料行 (資料集資料行):
l_shipmode
- 細胞
- 資料集資料行:
l_quantity
- 匯總類型:總和
- 資料集資料行:
SQL 查詢 :針對此樞紐分析表視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.lineitem
Sankey
Sankey 圖表會將流程從一組值視覺化到另一組值。
注意
Sankey 視覺效果不會對結果集中的資料進行任何匯總。 所有匯總都必須在查詢本身內計算。
SQL 查詢 :針對此 Sankey 視覺效果,會使用下列 SQL 查詢來產生資料集。
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
太陽爆發序列
太陽爆發圖可協助使用同心圓將階層式資料視覺化。
注意
Sunburst 序列不會對結果集中的資料進行任何匯總。 所有匯總都必須在查詢本身內計算。
SQL 查詢 :針對此太陽爆發視覺效果,下列 SQL 查詢可用來產生資料集。
SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10
Table
資料表視覺效果會顯示標準資料表中的資料,但能夠手動重新排序、隱藏及格式化資料。 請參閱 資料表選項 。
注意
資料表視覺效果不會對結果集中的資料進行任何匯總。 所有匯總都必須在查詢本身內計算。
如需資料表組態選項,請參閱 資料表組態選項 。
Word 雲端
文字雲端會以視覺化方式表示資料中出現單字的頻率。
注意
Word cloud 僅支援最多 64,000 個數據列的匯總。 如果資料集大於 64,000 個數據列,則會截斷資料。
組態值 :針對此單字雲端視覺效果,已設定下列值: 測試
- Words 資料行 (資料集資料行):
o_comment
- 字組長度限制:5
- 頻率限制:2
SQL 查詢 :針對此單字雲端視覺效果,下列 SQL 查詢可用來產生資料集。
select * from samples.tpch.orders