Databricks 笔记本中的可视化效果

Azure Databricks 在 Databricks SQL 和笔记本中内置了对图表和可视化效果的支持。 本页介绍如何使用 Databricks 笔记本中的可视化效果。 若要了解如何在 Databricks SQL 中使用可视化效果,请参阅 Databricks SQL 中的可视化效果

若要查看可视化效果的类型,请参阅可视化效果类型

重要

有关 Azure Databricks 图表预览版本的信息,请参阅预览图表可视化效果

新建可视化效果

若要重新创建本部分中的示例,请使用以下代码:

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

若要创建可视化效果,请单击结果上方的 + 并选择“可视化效果”。 这会显示可视化效果编辑器。

新建可视化效果菜单

  1. 在“可视化效果类型”下拉菜单中,选择一种类型。

    可视化效果编辑器

  2. 选择要在可视化效果中显示的数据。 可用的字段取决于所选的类型。

  3. 单击“保存” 。

可视化工具

如果将鼠标悬停在可视化效果编辑器中图表的右上方,则会显示一个 Plotly 工具栏,可在其中执行“选择”、“缩放”和“平移”等操作。

笔记本可视化效果编辑器工具栏

如果将鼠标悬停在可视化效果编辑器外部的图表右上角,则会出现一个较小的工具子集:

笔记本图表工具栏

创建新的数据配置文件

备注

在 Databricks Runtime 9.1 LTS 及更高版本中可用。

数据配置文件以表格和图形格式显示 Apache Spark DataFrame、pandas DataFrame 或 SQL 表的摘要统计信息。 若要基于结果单元格创建数据配置文件,请单击 +,并选择“数据配置文件”。

Azure Databricks 计算并显示摘要统计信息。

数据配置文件

  • 数值特征和分类特征显示在单独的表中。
  • 在选项卡的顶部,可对特征进行排序或搜索。
  • 在图表列的顶部,可选择显示直方图(标准)或分位数。
  • 选中“展开”可放大图表。
  • 选中“日志”可按对数刻度显示图表。
  • 可将光标悬停在图表上以获得更多详细信息,如直方图列的边界和其中的行数,或分位数值。

你也可以通过编程方式生成数据配置文件;请参阅汇总命令 (dbutils.data.summarize)

使用可视化效果和数据配置文件

注意

数据配置文件在 Databricks Runtime 9.1 LTS 及更高版本中可用。

重命名、复制或删除可视化效果或数据配置文件

若要重命名、复制或删除可视化效果或数据配置文件,请单击选项卡名称右侧的向下箭头。

笔记本可视化效果下拉菜单

还可以通过直接单击名称并就地编辑名称来更改名称。

编辑可视化效果

单击可视化效果下方的 编辑可视化效果按钮,打开可视化效果编辑器。 完成更改后,单击“保存”。

编辑颜色

可以在创建可视化效果或对其进行编辑时自定义可视化效果的颜色。

  1. 创建或编辑可视化效果。
  2. 单击“颜色”。
  3. 若要修改颜色,请单击该方块,并执行下列操作之一来选择新颜色:
    • 在颜色选择器中单击颜色。
    • 输入一个十六进制值。
  4. 单击颜色选择器外部的任意位置以将其关闭并保存更改。

暂时隐藏或显示一个系列

若要在可视化效果中隐藏系列,请单击图例中的系列。 若要再次显示该系列,请在图例中再次单击该系列。

若要仅显示单个系列,请双击图例中的系列。 若要显示其他系列,请单击各个系列。

下载可视化效果

要下载 .png 格式的可视化效果,请在笔记本单元格或可视化效果编辑器中单击相机图标 相机图标

  • 在结果单元格中,将光标移到单元格上方时,相机图标将显示在右上角。

    笔记本单元格中的相机

  • 在可视化效果编辑器中,将光标移到图表上时,将显示相机图标。 请参阅可视化效果工具

向仪表板添加可视化效果或数据配置文件

  1. 单击选项卡名称右侧的向下箭头。
  2. 选择“添加到仪表板”。 此时会显示可用仪表板视图的列表,以及“添加到新仪表板”菜单选项。
  3. 选择仪表板或选择“添加到新仪表板”。 此时会显示仪表板,包括新添加的可视化效果或数据配置文件。