DBeaver 与 Azure Databricks 集成

备注

本文介绍由第三方开发的 DBeaver。若要联系供应商，请查看 GitHub 上 dbeaver/dbeaver 存储库的问题页面。

DBeaver 是面向开发人员、数据库管理员、数据分析师、数据工程师和需要处理数据库的其他人的本地多平台数据库工具。 DBeaver 支持 Azure Databricks 和其他常用数据库。

本文介绍如何使用本地开发计算机来安装、配置和使用免费的开源 DBeaver Community Edition （CE）来处理 Azure Databricks 中的数据库。

备注

本文已使用 macOS、Databricks JDBC 驱动程序版本 2.6.36 进行测试，DBeaver CE 版本 23.3.0。

要求

安装 DBeaver 之前，本地开发计算机必须满足以下要求：

Linux 64 位、macOS 或 Windows 64 位操作系统。（支持 Linux 32 位，但不建议这样做。
将 Databricks JDBC 驱动程序安装到本地开发计算机上，并从下载的 DatabricksJDBC42.jar 文件中提取 DatabricksJDBC42-<version>.zip 文件。

还必须具有 Azure Databricks 群集或 SQL 仓库才能与 DBeaver 连接。

下载并安装 DBeaver CE，如下所示：

Linux：从 DBeaver 网站上的下载页下载并运行其中一个 Linux 安装程序。此页上也提供了 snap 和 flatpak 安装选项。
macOS：使用 Homebrew 运行 brew install --cask dbeaver-community，或使用 MacPorts 运行 sudo port install dbeaver-community。 macOS 安装程序也可从 DBeaver 网站上的下载页获取。
Windows：使用 Chocolatey 运行 choco install dbeaver。还可以从 DBeaver 网站上的下载页获取 Windows 安装程序。

使用前面下载的 Databricks JDBC 驱动程序的相关信息设置 DBeaver。

使用 DBeaver 连接到群集或 SQL 仓库，以访问 Azure Databricks 工作区中的数据库。

在 DBeaver 中，单击 数据库 > 新数据库连接。
在“连接到数据库”对话框的“所有”选项卡上，单击“Databricks”，然后单击“下一步”。
单击 “主”选项卡，然后在 Azure Databricks 资源的 JDBC URL 字段中输入值。有关 JDBC URL 字段语法，请参阅 Databricks JDBC 驱动程序的身份验证设置。
单击 “测试连接”。

提示

在测试连接之前，应启动 Azure Databricks 资源。否则，在资源启动时，测试可能需要几分钟才能完成。
如果连接成功，请在“连接测试”对话框中，单击“确定”。
在“连接到数据库”对话框中，单击“完成”。

在 数据库导航器 窗口中，将显示一个 Databricks 条目。若要更改连接名称，使其更易于识别，请执行以下操作：

对要访问 DBeaver 的每个资源重复此步骤中的说明。

使用 DBeaver 访问 Azure Databricks 工作区中的数据对象，例如表和表属性、视图、索引、数据类型和其他数据对象类型。

在 DBeaver 的 数据库导航器 窗口中，右键单击要使用的连接。
如果连接已启用，请单击该选项。（如果禁用了连接，那么你已经连接上了。）

提示

在尝试连接到资源之前，应当启动资源。否则，在资源启动时，连接可能需要几分钟才能完成。
展开刚才连接到的连接。
展开并浏览可用的数据对象。双击数据对象以获取有关它的详细信息。

重复此步骤中的说明以访问其他数据对象。

使用 DBeaver 从 trips 目录的 samples 架构加载示例 nyctaxi 表。

在 DBeaver 的 数据库导航器 窗口中，右键单击要使用的连接。
如果连接已启用，请单击该选项。（如果禁用了连接，那么你已经连接上了。）

提示

在尝试连接到资源之前，应当启动资源。否则，在资源启动时，连接可能需要几分钟才能完成。
单击 SQL 编辑器 > 新建 SQL 脚本。
在“（connection-name）Script-1 选项卡上，输入以下 SQL 语句：
```
SELECT * FROM samples.nyctaxi.trips;
```
单击 SQL 编辑器 > 执行 SQL 脚本。