Databricks SQL 中的可视化效果

Azure Databricks 在 Databricks SQL 和笔记本中内置了对图表和可视化效果的支持。 本页介绍如何使用 Databricks SQL 中的可视化效果。 若要了解如何在笔记本中使用可视化效果,请参阅 Databricks 笔记本中的可视化效果

若要查看可用的可视化类型,请参阅 可视化类型

创建可视化效果

  1. 在 SQL 编辑器中运行以下查询。 在查询下方的小部件中输入 10001 作为参数。

    USE CATALOG samples;
    SELECT
       hour(tpep_dropoff_datetime) as dropoff_hour,
       COUNT(*) AS num
    FROM samples.nyctaxi.trips
    WHERE pickup_zip IN ({{pickupzip}})
    GROUP BY 1
    

    添加可视化效果

  2. 运行查询后,在“结果”面板中单击 ,然后选择“可视化效果”。

  3. 输入可视化效果名称,例如 拖放率,作为可视化编辑器中的新标题。

  4. 在“可视化效果类型”下拉列表中,选择“条形图”。

  5. 查看可视化效果属性。

    配置图表

  6. 单击“保存” 。

编辑可视化效果

若要编辑可视化效果,请执行以下操作:

  • 单击可视化选项卡中的向下箭头。然后单击“编辑”。
  • 使用 可视化编辑器 中的选项卡访问和编辑图表的不同部分。

克隆可视化效果

克隆可视化效果:

  1. 在 SQL 编辑器中打开可视化效果。
  2. 单击可视化选项卡中的向下指向箭头。然后单击 复制

在可视化效果中启用聚合

对于条形图、折线图、面积图、饼图和热度图,可以直接在可视化效果中添加聚合,而不是修改查询以添加聚合列。 此方法具有以下优点:

  • 无需修改基础 SQL。
  • 通过修改聚合,可以快速执行基于方案的数据分析。
  • 聚合适用于整个数据集,而不仅仅是表中显示的前 64,000 行。

聚合可用于以下可视化效果:

  • 条形图
  • 区域
  • Pie
  • 热度地图
  • 直方图

聚合不支持组合可视化效果,例如在同一图表中显示折线图和条形图。 若要创建新的组合图表,请克隆旧的可视化效果。

表可视化效果仅显示前 64,000 行。

聚合可视化效果的 Y 轴列:

  1. 在 SQL 编辑器中,创建新的可视化效果或编辑现有可视化效果。

    如果看到消息 This visualization uses an old configuration. New visualizations support aggregating data directly within the editor,则必须先重新创建可视化效果,然后才能使用聚合。

  2. 在 Y 轴列旁边,为数值类型选择以下聚合类型:

    • 总和(默认)
    • 平均值
    • 计数
    • Count Distinct
    • Max
    • Min
    • 中值

    对于字符串类型,选择以下聚合类型:

    • 计数
    • Count Distinct

    所做的更改将应用于可视化效果的预览。

  3. 单击“保存” 。

  4. 可视化效果展示了聚合的行数。

在某些情况下,你可能不希望在 Y 轴列上使用聚合。 若要关闭聚合,请单击“Y 列”旁边的串形菜单 Kebab 菜单,然后取消选中“使用聚合”。

暂时隐藏或仅显示一个系列

若要在可视化效果中隐藏系列,请单击图例中的系列。 若要再次显示该系列,请在图例中再次单击该系列。

若要仅显示单个系列,请双击图例中的系列。 若要显示其他系列,请单击各个系列。

颜色

图表可视化效果具有为美学和可读性选择的默认颜色。

调色板

可以在创建可视化效果或对其进行编辑时自定义可视化效果的颜色。

  1. 创建或编辑可视化效果。
  2. 单击“颜色”。
  3. 若要修改颜色,请单击该方块,并执行下列操作之一来选择新颜色:
    • 在颜色选择器中单击颜色。
    • 输入一个十六进制值。
  4. 单击颜色选择器之外的任意位置将其关闭。
  5. 可视化效果编辑器 中单击“保存 以保存更改。

将可视化效果下载为 CSV、TSV 或 Excel 文件

若要将可视化效果下载为 CSV、TSV 或 Excel 文件,请单击可视化效果名称旁边的向下箭头,然后选择所需的下载类型。 如果可视化效果使用聚合,下载的结果也会聚合。 下载的结果来自最近一次的查询,该查询创建了可视化。

下载制表符分隔

将图表可视化作为 PNG 文件下载

若要将可视化效果下载为 PNG 文件,请将鼠标悬停在画布上,然后单击右上角的下载图标。

单击下载以将可视化效果导出为 PNG 文件

PNG 文件将下载到设备。

浏览图表数据

使用以下功能来帮助分析图表数据。

系列选择

若要选择要在图表上分析的特定序列,请使用以下命令:

  • 单击单个图例项可选择该系列
  • 按 Cmd/Ctrl 并单击图例项可选择或取消选择多个系列

系列选择

已排序的工具提示

使用折线图和非堆积条形图上的工具提示(按数量级排序)进行快速分析。

已排序的工具提示

缩放

对于数据密集的图表,聚焦于单个数据点有助于分析详细信息并去除离群值。 若要放大图表,请单击画布并拖动。 若要清除缩放,请将鼠标悬停在画布上,然后单击可视化效果右上角的 “清除缩放”按钮。

放大以查看详细信息

将可视化效果添加到仪表板

  1. 单击可视化效果下方的 kebab 菜单 Kebab 菜单 按钮。

  2. 选择“添加到仪表板”。

  3. 输入仪表板名称。 将显示匹配仪表板的列表。

  4. 选择仪表板。

    选择仪表板

  5. 单击“确定”。 此时会显示一个弹出窗口,其中包含指向仪表板的链接。

    已添加到仪表板

若要了解如何在仪表板上编辑可视化效果,请参阅 可视化效果

旧版可视化效果

默认情况下,图表可视化效果的最新版本处于打开状态。 本节中的设置描述了在使用较旧图表或在最新版本未激活的情况下可能会遇到的旧版可视化效果。

可视化工具

如果将鼠标悬停在可视化编辑器中图表的右上角,将显示一个 Plotly 工具栏,你可以在其中执行选择、缩放和平移等操作。

Plotly 工具栏

如果未看到工具栏,可能是管理员 禁用了工具栏显示

自定义调色板

注意

默认情况下,如果旧仪表板使用自定义调色板,则选择的可视化效果颜色将被忽略。 若要替代此设置,请参阅对可视化效果使用不同的颜色