Databricks 笔记本中的可视化效果
Azure Databricks 在 Databricks SQL 和笔记本中内置了对图表和可视化效果的支持。 本页介绍如何使用 Databricks 笔记本中的可视化效果。 若要了解如何在 Databricks SQL 中使用可视化效果,请参阅 Databricks SQL 中的可视化效果。
若要查看可视化效果的类型,请参阅可视化效果类型。
重要
有关 Azure Databricks 图表预览版本的信息,请参阅预览图表可视化效果。
新建可视化效果
若要重新创建本部分中的示例,请使用以下代码:
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
若要创建可视化效果,请单击结果上方的 + 并选择“可视化效果”。 这会显示可视化效果编辑器。
在“可视化效果类型”下拉菜单中,选择一种类型。
选择要在可视化效果中显示的数据。 可用的字段取决于所选的类型。
单击“保存” 。
可视化工具
如果将鼠标悬停在可视化效果编辑器中图表的右上方,则会显示一个 Plotly 工具栏,可在其中执行“选择”、“缩放”和“平移”等操作。
如果将鼠标悬停在可视化效果编辑器外部的图表右上角,则会出现一个较小的工具子集:
创建新的数据配置文件
备注
在 Databricks Runtime 9.1 LTS 及更高版本中可用。
数据配置文件以表格和图形格式显示 Apache Spark DataFrame、pandas DataFrame 或 SQL 表的摘要统计信息。 若要基于结果单元格创建数据配置文件,请单击 +,并选择“数据配置文件”。
Azure Databricks 计算并显示摘要统计信息。
- 数值特征和分类特征显示在单独的表中。
- 在选项卡的顶部,可对特征进行排序或搜索。
- 在图表列的顶部,可选择显示直方图(标准)或分位数。
- 选中“展开”可放大图表。
- 选中“日志”可按对数刻度显示图表。
- 可将光标悬停在图表上以获得更多详细信息,如直方图列的边界和其中的行数,或分位数值。
你也可以通过编程方式生成数据配置文件;请参阅汇总命令 (dbutils.data.summarize)。
使用可视化效果和数据配置文件
注意
数据配置文件在 Databricks Runtime 9.1 LTS 及更高版本中可用。
重命名、复制或删除可视化效果或数据配置文件
若要重命名、复制或删除可视化效果或数据配置文件,请单击选项卡名称右侧的向下箭头。
还可以通过直接单击名称并就地编辑名称来更改名称。
编辑可视化效果
单击可视化效果下方的 ,打开可视化效果编辑器。 完成更改后,单击“保存”。
编辑颜色
可以在创建可视化效果或对其进行编辑时自定义可视化效果的颜色。
- 创建或编辑可视化效果。
- 单击“颜色”。
- 若要修改颜色,请单击该方块,并执行下列操作之一来选择新颜色:
- 在颜色选择器中单击颜色。
- 输入一个十六进制值。
- 单击颜色选择器外部的任意位置以将其关闭并保存更改。
暂时隐藏或显示一个系列
若要在可视化效果中隐藏系列,请单击图例中的系列。 若要再次显示该系列,请在图例中再次单击该系列。
若要仅显示单个系列,请双击图例中的系列。 若要显示其他系列,请单击各个系列。
下载可视化效果
要下载 .png 格式的可视化效果,请在笔记本单元格或可视化效果编辑器中单击相机图标 。
在结果单元格中,将光标移到单元格上方时,相机图标将显示在右上角。
在可视化效果编辑器中,将光标移到图表上时,将显示相机图标。 请参阅可视化效果工具。
向仪表板添加可视化效果或数据配置文件
- 单击选项卡名称右侧的向下箭头。
- 选择“添加到仪表板”。 此时会显示可用仪表板视图的列表,以及“添加到新仪表板”菜单选项。
- 选择仪表板或选择“添加到新仪表板”。 此时会显示仪表板,包括新添加的可视化效果或数据配置文件。