仪表板

可以使用仪表板生成数据可视化,并与团队共享详细的数据见解。 最新版本的仪表板具有增强的可视化库和简化的配置体验,以便可以快速将数据转换为可共享的见解。

注意

仪表板(以前是 Lakeview 仪表板)现已正式发布。

仪表板在 Microsoft Azure 政府区域中不可用。 使用旧版仪表板

  • 原始 Databricks SQL 仪表板现在称为旧版仪表板。 它们将继续得到支持并通过关键的 bug 修复进行更新,但新功能将受到限制。 你可以继续使用旧版仪表板进行创作和消耗。
  • 使用迁移工具或 REST API 转换旧版仪表板。 有关使用内置迁移工具的说明,请参阅将旧版仪表板克隆到 Lakeview 仪表板。 有关如何使用 REST API 创建和管理仪表板的教程,请参阅使用 Azure Databricks API 管理仪表板

仪表板具有以下组件:

  • 数据:“数据”选项卡允许用户定义要在仪表板中使用的数据集。 使用 UI 或 API 共享、导入或导出数据集时,数据集与仪表板捆绑在一起。
  • 画布:“画布”选项卡允许用户创建可视化效果并构造其仪表板

注意

每个仪表板最多可以定义 100 个数据集。 “画布”对于每个仪表板最多可包含 100 个小组件。

定义数据集

使用“数据”选项卡定义仪表板的基础数据集

可以将数据集定义为以下任意一种:

  • 针对一个或多个表或视图的新查询。
  • 现有的 Unity Catalog 表或视图。

可以在任何类型的表或视图中定义数据集。 可以通过编写其他查询或选择其他表或视图来定义多个数据集。

注意

请参阅将旧版仪表板克隆到 Lakeview 仪表板,了解如何从现有旧版仪表板创建新仪表板。 若要将单个 Databricks SQL 查询迁移到新仪表板,请使用仪表板的“数据”选项卡中的“+ 从 SQL 创建”选项。 在编辑器中复制并粘贴 Databricks SQL 查询文本。

定义数据集后,可以使用数据集名称右侧的 Kebab 菜单 垂直三点菜单以重命名、克隆或删除它。 还可以将数据集下载为 CSV、TSV 或 Excel 文件。

菜单显示数据集选项

数据集优化

仪表板数据集包括以下性能优化:

  • 如果数据集结果大小较小(小于 64K 行),则会将数据集结果拉取到客户端,并在客户端上执行特定于可视化效果的筛选和聚合。 筛选和聚合小型数据集的数据非常快,并且确保数据集较小有助于优化仪表板性能。 对于小型数据集,只有数据集查询会出现查询历史记录中。
  • 如果数据集结果大小较大(>= 64K 行),数据集查询文本将包装在 SQL WITH 子句中,并且特定于可视化效果的筛选和聚合将在后端(而不是客户端)的查询中执行。 对于大型数据集,可视化查询将出现在查询历史记录中。
  • 对于发送到后端的可视化查询,针对共享相同 GROUP BY 子句和筛选谓词的同一数据集的多个单独可视化查询将组合为单个查询以供执行。 在这种情况下,用户可能会在查询历史记录中看到一个组合查询,该查询将提取多个可视化效果的结果。

在画布上添加或删除可视化效果、文本和筛选小组件

使用“画布”选项卡构造仪表板。 使用画布底部的工具栏添加小组件,如可视化效果、文本框和筛选器。

可视化效果

通过将可视化小组件添加到画布来创建可视化效果。 支持的可视化效果包括区域、条形图、组合图、计数器、热度地图、直方图、折线图、饼图、透视图、散点图和表格图表类型。

  • 使用 Databricks 助手:通过以自然语言描述想要查看的图表来创建可视化效果,并允许助手生成图表。 创建后,可以使用配置面板修改生成的图表。 不能使用助手创建表或数据透视表图表类型。
  • 使用配置面板:在可视化配置中应用其他聚合或时间箱,而无需直接修改数据集。 可以在配置面板中选择数据集、x 轴值、y 轴值和颜色。 有关每个受支持的可视化类型的配置详细信息和示例,请参阅仪表板可视化类型。 请参阅表选项,了解如何在表可视化效果中控制数据呈现。

注意

可视化小组件将保持空白,直到你描述所需的图表,或选择配置设置来定义要表示的数据集、图表类型和值。

文本小组件

Markdown 是用于在纯文本编辑器中设置文本格式的标记语言。 可以在文本小组件中使用 Markdown 设置文本格式、插入链接并将图像添加到仪表板。

  • 要在文本小组件中添加静态图像,请从公开的 URL 添加带有所需说明和 URL ![description](URL) 的 Markdown 图像语法。 例如,以下 markdown 将插入 Databricks 徽标的图像:![The Databricks Logo](https://upload.wikimedia.org/wikipedia/commons/6/63/Databricks_Logo.png)。 若要调整图像大小,请调整小组件尺寸的大小。
  • 若要从 DBFS 添加图像,请添加带有所需说明和 FileStore 路径的 markdown 图像语法:![description](files/path_to_dbfs_image)。 若要调整图像大小,请调整小组件尺寸的大小。 有关 DBFS 的详细信息,请参阅什么是 Databricks 文件系统 (DBFS)?

有关 Markdown 语法的详细信息,请参阅本指南

筛选器

筛选器是使仪表板查看者能够筛选字段或设置数据集参数的小组件。 可以将每个筛选器小组件配置为筛选数据集字段,或将值分配给数据集查询中的预定义参数。 单个筛选器小组件不能同时使用字段和参数。

筛选字段

仪表板支持以下用于筛选字段的筛选器类型:

  • 单选下拉列表
  • 多选下拉列表
  • 文本
  • Date
  • 日期范围

筛选器可以应用于一个或多个数据集的字段。 若要将筛选器连接到多个数据集中的字段,请添加多个字段,每个数据集最多添加一个字段。 此筛选器适用于基于所选数据集构建的所有可视化效果。 筛选器选择与所有其他筛选器级联。

仪表板筛选器始终应用于整个数据集。 如果数据集较小,则仪表板筛选器将直接在浏览器中应用,以提高性能。 如果数据集较大,则会将筛选器添加到在 SQL 仓库中运行的查询。

筛选参数

如果筛选器连接到参数,则无论数据集大小如何,它都会针对 SQL 仓库运行查询。

仪表板支持以下用于设置参数的筛选器类型:

  • 字符串
  • 日期
  • 日期和时间
  • Decimal
  • Integer

请参阅使用仪表板参数

注意

不支持使用参数指定日期范围。 若要指定日期范围,请对包含所需范围的开始日期和结束日期的字段应用筛选器。

复制小组件

使用键盘快捷方式复制所选小组件,并将其粘贴回画布上。 创建新小组件后,可以像编辑任何其他小组件一样对其进行编辑。

若要在草稿仪表板画布上克隆小组件,请完成以下步骤:

  • 右键单击小组件。
  • 单击“克隆”。

小组件的克隆显示在原始小组件下方。

删除小组件

通过选择小组件并按键盘上的删除键来删除小组件。 或者右键单击小组件。 然后单击“删除”

下载结果

可以将数据集下载为 CSV、TSV 或 Excel 文件。 在草稿仪表板中,从“数据”选项卡访问下载选项,或右键单击画布上的可视化效果。

可以以 CSV 和 TSV 格式下载最多约 1GB 的结果数据,并将最多 100,000 行数据下载到 Excel 文件中。

最终文件下载大小可能略大于或小于 1 GB,因为 1 GB 限制应用于最终文件下载之前的步骤。

对于已发布的仪表板,查看者可以通过右键单击可视化效果来下载结果。

工作区管理员可以调整其安全设置,以防止用户使用以下步骤下载结果:

  1. 单击 Azure Databricks 工作区顶部栏中的用户名,然后选择“设置”
  2. 单击 “安全性”
  3. 关闭“SQL 结果下载”选项。

在仪表板上起草和协作

新仪表板从草稿开始。 可以与工作区中的其他用户共享草稿以进行协作。 所有用户都使用自己的凭据与仪表板草稿中的数据和可视化效果进行交互。

有关权限级别的详细信息,请参阅仪表板 ACL

发布仪表板

发布仪表板以创建当前仪表板的全新副本,你可以与 Azure Databricks 工作区中的任何用户共享。 发布仪表板后,在再次发布之前,已发布的版本将保持不变并可供共享。 可以继续在草稿版本中进行修改和改进,而不会影响公开共享的副本。

发布不会自动与用户共享仪表板。 可以向用户或组显式共享具有查看权限的仪表板。

必须至少拥有“可编辑”权限才能发布仪表板。

  1. 打开一个仪表板。
  2. 在右上角的“共享”下拉菜单中,点击“发布”。 此时将显示“发布”对话框
  3. 选择要用于已发布仪表板的凭据。 可以选择嵌入凭据。
  • 嵌入凭据:已发布仪表板的所有查看者都可以使用数据和计算凭据运行查询。 这样,即使用户无权访问基础数据或 SQL 仓库,也可以查看仪表板。 这种情况可能会向尚未被授予直接访问权限的用户公开数据。 这是默认选项。
  • 不嵌入凭据:已发布仪表板的所有观看者都使用自己的数据和计算凭据运行查询。 观看者需要访问工作区、附加的 SQL 仓库和关联数据才能在仪表板中查看结果。
  1. 单击“发布” 。

可以将已发布的仪表板与 Azure Databricks 工作区中的任何用户共享。 有关控制对仪表板的访问的详细信息,请参阅仪表板 ACL

若要访问已发布的仪表板,请单击仪表板顶部附近的下拉菜单中的“已发布”

显示可用草稿和已发布仪表板版本的下拉菜单。

仪表板查询执行

每当用户打开草稿或已发布的仪表板或执行诸如筛选等交互时,仪表板都会运行查询。

(可选)可以在具有嵌入凭据的已发布仪表板上创建计划。 使用嵌入凭据在已发布的仪表板上创建计划,可以将仪表板的定期 PDF 快照发送给收件人。 每个计划的更新都会刷新仪表板中的可视化效果使用的查询。

可视化效果使用的查询并不总是与数据集精确对应。 例如,如果将聚合应用于可视化效果,可视化效果将显示聚合值。 自上次运行查询以来,交互式仪表板会自动使用缓存的查询结果。

安排仪表板定期更新

可以设置计划更新以自动刷新仪表板,并定期向订阅者发送包含最新数据的电子邮件。

具有至少“可编辑”权限的用户可以创建计划,让使用嵌入凭据的已发布仪表板能定期运行。 每个仪表板最多可以有 10 个计划。

对于每个计划的仪表板更新,将发生以下情况:

  • 定义数据集的所有 SQL 逻辑都以指定的时间间隔运行。
  • 结果会填充查询结果缓存,并帮助改进初始仪表板加载时间。

若要创建计划,请执行以下操作:

  1. 单击仪表板右上角的“计划”。 此时会显示“添加计划”对话框。

    “添加计划”对话框

  2. 使用下拉选择器指定频率和时区。 (可选)选择“显示 cron 语法”复选框以在“Quartz Cron 语法”中编辑时间表。

  3. 单击 “创建” 。 将显示“计划”对话框,并显示所创建的计划。 如果此仪表板存在其他计划,对话框还会显示这些计划。

  4. (可选)单击“订阅”将自己添加为订阅者,并在计划运行完成后收到包含仪表板 PDF 快照的电子邮件。

注意

如果已为此仪表板创建计划,右上角的按钮会显示“订阅”。 可以使用前面描述的工作流添加计划。

管理订阅

计划订阅者每次运行计划时都会收到一封电子邮件,其中包含当前仪表板的 PDF 快照。 符合条件的订阅者包括工作区用户和电子邮件通知目标。

工作区管理员必须先定义电子邮件通知目标,然后才能将其选为订阅者。 请参阅管理通知目标。 帐户用户、通讯组列表和帐户外部的用户(如合作伙伴或客户端组织中的用户)可以配置为电子邮件通知目标并订阅。 但是,这些用户无法直接订阅。

重要

订阅列表最多可以包含 100 个订阅者。 无论发送的电子邮件数如何,电子邮件通知目标都算作一个订阅者。

如果你在仪表板上至少具有“可编辑”权限,可以添加和移除其他订阅者以接收更新。 如果你在仪表板上至少具有“可查看”权限,则可以将自己作为订阅者添加到现有计划

  • 若要订阅其他用户:

    1. 单击仪表板右上角的“订阅”。 随即将出现“计划”对话框。
    2. 确定要将订阅者添加到的计划。 单击该计划右侧的 Kebab 菜单。 然后单击“编辑”。

    注意

    还可以使用此上下文菜单暂停或删除计划。

    如果你对含有已分配计划的仪表板具有“可查看”访问权限,则可以订阅自己以便在每次计划运行时接收更新

  • 若要为自己订阅现有计划,请执行以下操作:

    1. 单击仪表板右上角的“订阅”按钮。 “计划”对话框显示仪表板的所有计划。
    2. 单击所选计划右侧的“订阅”

    如果无法将自己添加为订阅者,请检查是否存在以下原因:

    • 工作区管理员已关闭为工作区“启用仪表板订阅”选项。

      此设置优先于所有其他设置。 如果工作区管理员已关闭此设置,仪表板编辑器仍可以分配计划,但无法分配订阅者。

    • 仪表板不与嵌入凭据共享。

      没有嵌入凭据的共享仪表板无法分配计划,因此无法为其分配订阅者。

    • 你必须有权访问该工作区。

      帐户用户只能作为电子邮件通知目标添加为订阅者。 帐户用户的仪表板上没有“订阅”按钮。

    • 未定义任何角色。

      对于没有定义计划的仪表板,具有“可查看”或“可运行”访问权限的工作区用户无法与“订阅”按钮交互

取消订阅电子邮件更新

订阅者可以选择通过取消订阅计划来停止接收电子邮件。

  • 若要使用仪表板 UI 取消订阅,请执行以下操作:

    1. 单击仪表板右上角的“订阅”按钮。 “计划”对话框显示仪表板的所有计划。
    2. 单击“已订阅”以取消订阅。 按钮文本会更改为“订阅”

    从“已订阅”到“订阅”的 UI 更改。

  • 使用电子邮件页脚中的“取消订阅”链接取消订阅计划更新。

注意

当用户(包含在为电子邮件通知设置的较大通讯组列表中)选择使用电子邮件页脚中的链接取消订阅时,该操作将取消订阅整个通讯组列表。 整个组会从订阅中移除,而不会收到将来的 PDF 快照更新。

工作区管理员订阅控制

工作区管理员可以阻止用户使用订阅分发仪表板。

若要防止共享电子邮件更新,请执行以下操作:

  1. 单击 Azure Databricks 工作区顶部栏中的用户名,然后选择“设置”
  2. 单击通知
  3. 关闭“启用仪表板电子邮件订阅”选项。

更改此设置可防止所有用户添加电子邮件订阅者。 仪表板编辑者无法添加订阅者,而仪表板查看者没有订阅仪表板的选项。

如果关闭此设置,则会暂停现有订阅,并且没有人可以修改现有订阅列表。 如果重新打开此设置,订阅将使用现有列表恢复。

订阅的仪表板大小限制

仪表板订阅电子邮件包括以下 base64 编码文件:

  • PDF:包含完整仪表板的 PDF 文件。
  • DesktopImage:针对在台式计算机上查看进行优化的图像文件。

对两个文件的组合大小施加了 9MB 的上限。 以下说明概述了合并文件大小超过上限时的预期行为:

  • 如果 PDF 文件大于 9MB:订阅电子邮件不包含 PDF 附件或任何图像。 它包含一条注释,指出仪表板已超出大小限制,并显示当前仪表板的实际文件大小。
  • 如果合并文件大小大于 9MB:只有 PDF 附加到电子邮件。 内联消息包含指向仪表板的链接,但没有图像。

转让仪表板的所有权

如果你是工作区管理员,则可以将仪表板的所有权转让给其他用户。

  1. 导航到仪表板列表。 单击仪表板名称进行编辑。
  2. 单击“共享”。
  3. 单击“共享”对话框右上角的 齿轮图标 图标。 带有齿轮图标的“共享”对话框
  4. 开始键入用户名以搜索并选择新所有者。
  5. 单击“确认” 。

新所有者会显示在“共享”对话框中,且具有 CAN MANAGE 权限。 若要查看所有者列出的仪表板,请通过选择 Dashboards Icon 转到可用仪表板列表。

导出、导入或替换仪表板

为了便于在不同工作区之间共享可编辑的仪表板,可以将仪表板作为文件进行导出和导入操作。 要将仪表板传输到其他工作区,请将其导出为文件,然后将其导入新工作区。 还可以就地替换仪表板文件。 这意味着,直接编辑仪表板文件时,可以将该文件上传到原始工作区,并在维护现有共享设置的同时覆盖现有文件。

以下步骤说明如何在 UI 中导出和导入仪表板。 还可以使用 Databricks API 以编程方式导入和导出仪表板。 请参阅 POST /api/2.0/workspace/import

导出仪表板文件

  • 在草稿仪表板中,单击屏幕右上角的 Kebab 菜单 串形菜单,然后单击“导出仪表板”
  • 使用“导出仪表板”对话框确认或取消操作。 导出成功后,.lvdash.json 文件将保存到 Web 浏览器的默认下载目录。

导入仪表板文件

  • 在仪表板列表页中,单击 蓝色向下脱字号“>从文件导入仪表板”。
  • 单击“选择文件”以打开本地文件对话框,然后选择要导入的 .lvdash.json 文件。
  • 单击“导入仪表板”以确认并创建仪表板。

导入的仪表板将保存到你的用户文件夹。 如果与导入的仪表板同名的项已在该位置中存在,则会通过追加带括号的数字来创建唯一名称,从而自动解决冲突。

从文件替换仪表板

  • 在草稿仪表板中,单击屏幕右上角的 Kebab 菜单 垂直三点菜单,然后单击“替换仪表板”。
  • 单击“选择文件”以打开文件对话框,然后选择要导入的 .lvdash.json 文件。
  • 单击“覆盖”以覆盖现有仪表板。

什么是共享帐户?

使用仪表板共享帐户,用户可以与起草仪表板的工作区外部的用户和组共享已发布的仪表板。

将用户添加到 Databricks 帐户与将它们添加到工作区不同。 将用户添加到帐户时,其凭据不会向其授予对工作区、数据或计算资源的自动访问权限。 相反,注册会在系统中建立其标识,Azure Databricks 稍后将使用该标识来验证共享仪表板是否仅可供其预期收件人使用。

下图显示了在帐户级别跨多个工作区共享已发布仪表板的示例。

仪表板共享示例,如以下列表所述。

已发布的仪表板可以与以下内容共享:

  • 分配给原始工作区的一个或多个特定用户。
  • 工作区组(包括所有工作区用户)。
  • Azure Databricks 帐户中的一个或多个特定用户。
  • Azure Databricks 帐户组(包括所有帐户用户)。

有关 Azure Databricks 帐户中的用户和组关系的详细信息,请参阅管理员如何将用户分配到工作区?

如何与其他 Azure Databricks 帐户用户共享仪表板

草稿仪表板不能与相应工作区之外的用户共享。 已发布的仪表板可以与 Azure Databricks 帐户用户和组共享。 将用户和组添加到 Databricks 帐户不会自动分配任何工作区、数据或计算权限。 有关使用 Azure Databricks 进行标识管理的详细信息,请参阅管理用户、服务主体和组

请使用以下步骤发布仪表板并与帐户用户共享。

  • 导航到草稿仪表板。

  • 使用“嵌入凭据(默认)”设置发布仪表板。

    嵌入凭据意味着 SQL 仓库和查询将使用发布者的数据和仓库权限来更新已发布的仪表板。 如果想要与原始工作区之外的用户进行共享,则需要这样做,因为这些用户没有自己的凭据。

  • 单击“共享”按钮,然后使用“共享”对话框为 Databricks 帐户中的用户和组设置权限。

    • 在“共享”对话框顶部,输入工作区用户、工作区组、特定帐户用户或帐户组

    对于工作区中的用户,可以分配“可管理”、“可编辑”、“可运行”或“可查看”权限。 即使在共享模式中分配了更高的权限,帐户用户也只拥有“可查看”访问权限

    若要为所有帐户用户快速分配查看访问权限,请使用“共享”对话框底部的“共享设置”选项

    显示组织范围的共享设置的“共享”对话框

  • 与用户共享链接。

    单击“共享”对话框底部附近的“复制链接”,复制已发布仪表板的可共享 URL

注意

无权访问工作区的用户只拥有“可查看”权限。 如果向无权访问工作区的用户授予提升的权限(如“可编辑”),则权限会显示在 UI 中,但在将用户添加到工作区之前不会实际应用该权限

有关仪表板权限级别的详细信息,请参阅仪表板 ACL

网络注意事项

如果配置了 IP 访问列表,则帐户用户仅能从批准的 IP 范围(例如使用 VPN 时)访问发布到相应帐户的仪表板。 有关配置访问权限的详细信息,请参阅管理 IP 访问列表

监视 Lakeview 活动

管理员可以使用审核日志监视仪表板上的活动。 请参阅仪表板事件

使用 REST API 管理仪表板

有关演示如何使用 Azure Databricks REST API 管理仪表板的教程,请参阅使用 Azure Databricks API 管理仪表板。 包含的教程介绍如何将旧仪表板转换为 Lakeview 仪表板,以及如何创建、管理和共享它们。