仪表板可视化效果类型

本文概述了可用于 AI/BI 仪表板的视觉对象类型,并演示了如何创建每种视觉对象类型的示例。 有关生成仪表板的说明,请参阅创建仪表板。 可以使用自然语言提示助手创建条形图、折线图、点图、散点图、饼图和计数器图。 请参阅使用 Databricks 助手创建可视化效果

注释

为了优化性能,图表只能在画布上呈现 10K 行或 10MB,以较小的值为准。 否则,可视化可能会被截断。

区域可视化

面积图可视化效果结合了折线图和条形图可视化效果,用于显示一个或多个组的数值如何随着第二个变量的进度(通常是时间)发生变化。 面积图通常用于显示销售漏斗图随时间的变化。

为了调整布局:

  • 单击可视化效果编辑面板Kebab menu icon.的 Y 轴部分的
  • 在“布局”部分中,选择“堆栈”或“100% 堆栈”

区域可视化效果示例

配置值:对于提供的面积图可视化效果示例,以下值已设置:

  • 数据集:TPCH 订单
  • 可视化效果:面积图
  • 标题:Total price and order year by order priority and clerk
  • X 轴:
    • 字段:o_orderdate
    • 缩放类型:Temporal
    • 转换:Yearly
    • 轴标题:Order year
  • Y 轴:
    • 字段:o_totalprice
    • 轴标题:Total price
    • 缩放类型:Quantitative
    • 转换:Sum
  • 分组依据:
    • 字段:o_orderpriority
    • 图例标题:Order priority
  • 筛选
    • 字段:TPCH orders.o_clerk

SQL 查询:对于此面积图可视化效果,以下 SQL 查询用于生成名为 TPCH orders 的数据集。

SELECT * FROM samples.tpch.orders

条形图

条形图表示一段时间内或跨类别的指标变化,并显示比例关系,类似于饼图可视化效果。

条形图可视化效果示例

为了调整布局:

  • 单击可视化效果编辑面板Kebab menu icon.的 Y 轴部分的
  • 在“布局”部分中,选择“堆栈”或“100% 堆栈”或“组”

配置值:对于提供的条形图示例,以下值已设置:

  • 数据集:TPCH 订单
  • 可视化效果:条形图
  • 标题:Total price and order month by order priority and clerk
  • X 轴:
    • 字段:o_orderdate
    • 转换:Monthly
    • 缩放类型:Temporal
    • 轴标题:Order month
  • Y 轴:
    • 字段:o_totalprice
    • 缩放类型:Quantitative
    • 转换:Sum
    • 轴标题:Total price
  • 分组依据:
    • 字段:o_orderpriority
    • 图例标题:Order priority
  • 筛选
    • 字段:TPCH orders.o_clerk

SQL 查询:以下 SQL 查询会生成此条形图可视化效果的数据集 TPCH orders

SELECT * FROM samples.tpch.orders

箱线图

箱形图可视化效果显示数值数据的分布摘要(可以选择按类别分组)。 通过使用箱形图可视化效果,可以快速地跨类别比较值的范围,并通过其四分位数可视化值的位置、范围和偏斜组。 在每个箱中,较暗的线显示四分位数之间的范围。 有关解释箱型图的详细信息,请参阅维基百科上的箱型图条目

箱线图示例

对于提供的箱线图示例,已设置以下值:

  • X 列(数据集列):l-returnflag
  • Y 列(数据集列):l_extendedprice
  • X 轴标题:Return flag1
  • Y 轴标题:Extended price

SQL 查询:对于此箱形图可视化效果,以下 SQL 查询用于生成数据集

select * from samples.tpch.lineitem

气泡图

气泡图是每个点标记的大小反映相关指标的散点图。 若要创建气泡图,请选择“散点图”作为视觉对象类型。 在“大小”设置中,选择要用标记大小表示的指标。

气泡图视觉对象示例

配置值:对于提供的气泡图示例,已设置以下值:

  • 数据集:纽约市出租车行程
  • 可视化效果:散点图
  • 标题:Trip distance, fares, and trip duration
  • X 轴:
    • 字段:trip_distance
    • 缩放类型:Quantitative
    • 转换:None
  • Y 轴:
    • 字段:fare_amount
    • 缩放类型:Quantitative
    • 转换:None
  • 着色依据:
    • 字段:pickup_zip
  • 大小:
    • 字段:time_spent
    • 转换:None

地区分布图

在晕层图可视化中,地理区域(如国家或州)根据每个关键列的汇总值着色。 查询必须按名称返回地理位置。 用户可以创建显示国家、州、省、县或区级别的管理边界的地图。

Choropleth 映射示例

配置值:对于此色阶图可视化,已设置以下值:

  • 数据集:tcph nation
  • 国家: Country
  • 颜色:sum(c_acct_bal)

SQL 查询:对于此地区分布图可视化效果,以下 SQL 查询用于生成数据集。

SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1

组合图表

组合图结合折线图和条形图,以按比例呈现随时间的变化。

组合图示例

配置值:对于此组合图可视化效果,已设置以下值:

  • 数据集:partsupp
  • 可视化效果:组合图
  • X 轴:ps_partkey
    • 缩放类型:Quantitative
  • Y 轴:
    • 条形图​​:ps_availqty
    • 聚合类型:SUM
    • 折线图:ps_supplycost
    • 聚合类型:AVG
  • 按 Y 序列配色:
    • Sum of ps_availqty
    • Average ps_supplycost

SQL 查询:对于此组合图可视化效果,以下 SQL 查询用于生成数据集。

SELECT * FROM samples.tpch.partsupp

双轴组合图

可以使用组合图来显示两个不同的 y 轴。 选中组合图小组件后,单击 “Kebab”菜单图标。 图表配置面板中 的 Y 轴 设置上的烤肉串菜单。 启用“启用双轴”选项。

双轴组合图示例

配置值:对于此组合图,“启用双轴”选项处于打开状态。 其他配置如下所示:

  • 数据集:行程
  • 可视化效果:组合图
  • X 轴:tpep_pickup_datetime
    • 缩放类型:Temporal
    • 转换:Weekly
  • Y 轴:
    • 左 Y 轴(条形图):trip_distance
      • 转换:AVG
    • 右 Y 轴(线):fare_amount
      • 转换:AVG

按 Y 系列着色:

  • Average trip_distance
    • Average fare_amount

SQL 查询:以下 SQL 查询用于生成数据集:

SELECT * FROM samples.nyctaxi.trips

计数器可视化效果

计数器突出显示单个值,并带有将它们与目标值进行比较的选项。 若要使用计数器,请指定要在 “值 ”和 “目标 ”列的计数器可视化效果上显示的数据。 如果在可视化编辑器中应用聚合,则不能通过选择 值行号来比较值,如以下示例所示。 若要比较特定行值,请使用一个数据集,该数据集在定义其SQL中包含所有所需的聚合。 这样,你可以选择目标行和值行进行比较。

计数器示例

可以在“值”配置详细信息中设置条件格式并自定义文本样式。

显示的计数器图表的条件格式选项。

配置值:对于此计数器可视化效果示例,以下值已设置:

  • 数据集:计数器示例
  • 视觉对象:计数器
  • 标题:Orders: Total price by date (previous two days)
  • 值:
    • 字段:total price
    • 值行号:1
  • 目标:
    • 字段:total price
    • 值行号:2

SQL 查询:对于此计数器可视化效果,使用以下 SQL 查询生成数据集:

SELECT
  SUM(o_totalprice) as `total price`,
  o_orderdate
FROM
  samples.tpch.orders
GROUP BY o_orderdate
ORDER BY o_orderdate DESC

线条可视化

折线图可视化效果表示一个或多个指标随时间的变化。

折线图可视化效果示例

配置值:对于此折线图可视化效果示例,以下值已设置:

  • 数据集:TPCH 订单
  • 可视化效果:折线图
  • 标题:Average price and order year by order priority and clerk
  • X 轴:
    • 字段:o_orderdate
    • 转换:Yearly
    • 缩放类型:Temporal
    • 轴标题:Order year
  • Y 轴:
    • 字段:o_totalprice
    • 转换:Average
    • 缩放类型:Quantitative
    • 轴标题:Average price
  • 分组依据:
    • 字段:o_orderpriority
    • 图例标题:Order priority
  • 筛选
    • 字段:TPCH orders.o_clerk

SQL 查询:对于此条形图可视化效果,以下 SQL 查询用于生成名为 TPCH orders 的数据集。

SELECT * FROM samples.tpch.orders

热力图

热度地图融合了条形图、叠加图和气泡图的功能,支持使用颜色可视化数值数据。 热度地图的常用调色板使用橙色或红色等较暖颜色显示最高值,使用蓝色或紫色等较冷颜色显示最低值。

例如,下面的热度地图直观显示了每天最频繁出现的出租车乘坐距离,并按星期、距离和总费用对结果进行分组。

注释

热度地图最多可以显示 64K 行或 10MB。

热度地图示例

配置值:对于此热度地图可视化效果,已设置以下值:

  • 数据集:TPCH 订单
  • 可视化效果:热度地图
  • X 列(数据集列):o_orderpriority
  • Y 列(数据集列):o_orderstatus
  • 颜色列:
    • 数据集列:o_totalprice
    • 聚合类型:Average
  • X 轴名称(替代默认值):Order priority
  • Y 轴名称(替代默认值):Order status
  • 配色方案(替代默认值):YIGnBu

SQL 查询:对于此热度地图可视化效果,以下 SQL 查询用于生成数据集

SELECT * FROM samples.tpch.orders

直方图

直方图绘制给定值在数据集中出现的频率。 直方图可帮助你了解数据集的值是聚集在少数范围内还是分布范围更广。直方图显示为条形图,你可以在其中控制不同条形(也称为“箱”)的数量。

直方图示例

配置值:对于此直方图可视化效果,已设置以下值:

  • 数据集:TPCH 订单
  • 可视化:直方图
  • X 列(数据集列):o_totalprice
  • 箱数:20
  • X 轴名称(替代默认值):Total price

配置选项:有关直方图配置选项,请参阅直方图配置选项

SQL 查询:对于此直方图可视化效果,以下 SQL 查询用于生成数据集

select * from samples.tpch.orders

饼图可视化效果

饼图可视化效果显示指标之间的比例。 它们不是用来传输时序数据的。

饼图可视化效果示例

配置值:对于此饼图可视化效果示例,以下值已设置:

  • 数据集:TPCH 订单
  • 可视化效果:饼图可视化效果
  • 标题:Total price by order priority and clerk
  • 角度:
    • 字段:o_totalprice
    • 转换:Sum
    • 轴标题:Total price
  • 分组依据:
    • 字段:o_orderpriority
    • 图例标题:Order priority
  • 筛选
    • 字段:TPCH orders.o_clerk

SQL 查询:对于此饼图可视化效果,以下 SQL 查询用于生成名为 TPCH orders 的数据集。

SELECT * FROM samples.tpch.orders

数据透视图可视化效果

数据透视图可视化效果会将查询结果中的记录聚合到表格显示画面中。 它类似于 SQL 中的 PIVOTGROUP BY 语句。 使用拖放字段来配置数据透视图可视化效果。

注释

出于性能原因,透视表仅支持呈现 100 列 x 100 行。

数据透视图示例

配置值:对于此透视可视化示例,设置了以下值:

  • 数据集:TPCH 行项
  • 可视化效果:数据透视图
  • 标题:Line item quantity by return flag and ship mode by supplier
  • 行:
    • 字段:l_returnflag
  • 列:
    • 字段:l_shipmode
  • 单元格
    • 数据集:
    • 字段:l_quantity
    • 转换:求和
  • 筛选
    • 字段:TPCH lineitem.l_supplierkey

SQL 查询:对于此透视表可视化效果,以下 SQL 查询用于生成名为 TPCH lineitem 的数据集。

SELECT * FROM samples.tpch.lineitem

点图

点图将定量数据显示为放置在特定地图位置的符号。 标记使用纬度和经度坐标进行定位,这些坐标必须被包含为此图表类型的结果集的一部分。 以下示例使用纽约纽约机动车碰撞的数据。

点式地图示例

配置值:对于此点式地图可视化效果,已设置以下值:

  • 数据集:西雅图房价分析
  • 可视化效果:点图
  • 坐标:
    • 纬度:LATITUDE
    • 经度:LONGITUDE
  • 颜色:
    • 字段:avg(bedrooms)
      • 量表类型: 分类
  • 大小:
    • 字段:avg(price)

注释

没有 Databricks 数据集包含纬度或经度数据,因此,此示例不提供示例 SQL 查询。

Sankey 图

桑基图可以可视化展示一组数值到另一组数值的流动过程。

Sankey 示例

配置值:对于此 sankey 关系图,已设置以下值:

  • 数据集:Sankey 示例
  • 可视化效果:Sankey
  • 阶段
    • stage1
    • stage2
    • SUM(值)

SQL 查询:对于此 Sankey 可视化效果,以下 SQL 查询用于生成数据集

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

散点图可视化效果

散点可视化效果通常用于显示两个数值变量之间的关系。 可以使用颜色对第三个维度进行编码,以显示数值变量在各组中的差异。

散点示例

配置值:对于此散点图可视化效果示例,以下值已设置:

  • 数据集:TPCH 行项
  • 可视化效果:散点图
  • 标题:Total price and quantity by ship mode and supplier
  • X 轴:
    • 字段:l_quantity
    • 轴标题:Quantity
    • 缩放类型:Quantitative
    • 转换:None
  • Y 轴:
    • 字段:l_extendedprice
    • 缩放类型:Quantitative
    • 转换:None
    • 轴标题:Price
  • 分组依据:
    • 字段:l_shipmode
    • 图例标题:Ship mode
  • 筛选
    • 字段:TPCH lineitem.l_supplierkey

SQL 查询:对于此散点图可视化效果,以下 SQL 查询用于生成名为 TPCH lineitem 的数据集。

SELECT * FROM samples.tpch.lineitem

表可视化效果

表可视化效果显示标准表中的数据,但允许手动对数据重新排序、隐藏和设置格式。

注释

表最多可以显示 64K 行或 10MB。

表格示例

配置值:对于此表格可视化效果示例,以下值已设置:

  • 数据集:TPCH 行项
  • 可视化效果:表
  • 标题:Line item summary by supplier
  • 列:
    • 显示行号:已启用
    • 字段:l_orderkey
    • 字段:l_extendedprice
      • 显示为:Number
      • 数字格式:$0.00
    • 字段:l_discount
      • 显示为:Number
      • 数字格式:%0.00
    • 字段:l_tax
      • 显示为:Number
      • 数字格式:%0.00
    • 字段:l_shipdate
    • 字段:l_shipmode
  • 筛选
    • 字段:TPCH lineitem.l_supplierkey

配置选项:有关表可视化配置选项,请参阅 “表”选项

SQL 查询:对于此表格可视化效果,以下 SQL 查询用于生成名为 TPCH lineitem 的数据集。

SELECT * FROM samples.tpch.lineitem