笔记本输出和结果

将笔记本附加到群集运行一个或多个单元格后,笔记本就会有状态并会显示输出。 此部分介绍如何管理笔记本状态和输出。

清除笔记本状态和输出

要清除笔记本状态和输出,请选择“运行”菜单底部的“清除”选项之一。

菜单选项 描述
清除所有单元格输出 清除单元格输出。 如果你要共享笔记本但不想包含任何结果,此选项非常有用。
清除状态 清除笔记本状态,包括函数和变量定义、数据和导入的库。
清除状态和输出 清除单元格输出和笔记本状态。
清除状态并运行全部 清除笔记本状态并启动新的运行。

显示结果

运行单元格时,表结果最多返回 10,000 行或 2 MB,以较小者为准。

默认情况下,文本结果最多返回 50,000 个字符。 使用 Databricks Runtime 12.2 LTS 及更高版本时,可以通过设置 Spark 配置属性 spark.databricks.driver.maxReplOutputLength 来增加此上限。

使用 Python 以本机方式浏览 Python 笔记本中的 SQL 单元格结果

可以使用 SQL 加载数据,并使用 Python 浏览数据。 在 Databricks Python 笔记本中,SQL 语言单元格中的表结果自动作为 Python 数据帧提供。 有关详细信息,请参阅在 Python 笔记本中浏览 SQL 单元格结果

新单元格结果表

重要

此功能目前以公共预览版提供。

现在可以选择新的单元格结果表呈现。 使用新的结果表,可以执行以下操作:

  • 将一列或表格结果的其他部分复制到剪贴板。
  • 对结果表进行文本搜索。
  • 对数据进行排序和筛选
  • 使用键盘箭头键在表格单元格之间导航。
  • 选择列名或单元格值的一部分,方法是双击并拖动以选择所需文本。

若要启用新结果表,请单击单元格结果右上角的“新结果表”,并将拨动选择器从“OFF”更改为“ON”

新结果显示选择器

启用该功能后,可以单击列或行标题以选择整个列或行,并且可以单击表中左上角的单元格以选择整个表。 可以将光标拖动到任何一组矩形单元格上以选择它们。

若要将所选数据复制到剪贴板,请在 MacOS 上按 Cmd + c 或在 Windows 上按 Ctrl + c,或者右键单击并从下拉菜单中选择“复制”

若要在结果表中搜索文本,请在“搜索”框中输入文本。 匹配单元格会突出显示。

若要打开显示所选内容信息的侧面板,请单击“搜索”框旁边右上角的面板图标 面板图标 图标

面板图标的位置

列标题指示列的数据类型。 例如,整数类型列的指示器 指示整数数据类型。 将鼠标悬停在指示器上可查看数据类型。

对结果进行排序和筛选

使用新的单元格结果表进行呈现时,可以对结果进行排序和筛选。

若要按列中的值对表进行排序,请将光标悬停在列名上。 在包含列名称的单元格右侧,将显示一个图标。 单击箭头对列进行排序。 连续单击可在按升序排序、按降序排序或取消排序之间进行切换。

如何对列进行排序

若要按多个列进行排序,请按住 Shift 键,同时单击这些列的排序箭头

若要创建筛选器,请单击单元格结果右上角的 筛选器图标。 在出现的对话框中,选择要筛选的列以及要应用的筛选规则和值。 例如:

筛选器示例

若要再添加一个筛选器,请单击 “添加筛选器”按钮

若要暂时启用或禁用筛选器,请在对话框中切换“启用/禁用”按钮。 若要删除筛选器,请单击筛选器名称 删除筛选器 X 旁边的 X。

若要按特定值进行筛选,请右键单击包含该值的单元格,然后从下拉菜单中选择“按此值筛选”

特定值

还可以从列名称中的 kebab 菜单创建筛选器:

筛选 kebab 菜单

筛选器仅应用于结果表中显示的结果。 如果返回的数据被截断(例如,查询返回超过 64,000 行时),筛选器将仅应用于返回的行。

下载结果

默认情况下已启用“下载结果”。 若要切换此设置,请参阅管理从笔记本下载结果的功能

可以将包含表格输出的单元格结果下载到本地计算机。 单击选项卡标题旁边的向下箭头。 菜单选项取决于结果中的行数和 Databricks Runtime 版本。 下载的结果以名为 export.csv 的 CSV 文件的形式保存在本地计算机上。

下载单元格结果

查看每个单元格的多个输出

Python 笔记本以及非 Python 笔记本中的 %python 单元格支持每个单元格多个输出。 例如,以下代码的输出包括绘图和表:

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

在 Databricks Git 文件夹中提交笔记本输出

要了解如何提交 .ipynb 笔记本输出,请参阅允许提交 .ipynb 笔记本输出

  • 笔记本必须是 .ipynb 文件
  • 工作区管理员设置必须允许提交笔记本输出。