DataGrip 与 Azure Databricks 的集成

注意

本文介绍了 Databricks 既不提供也不支持的 DataGrip。 若要联系提供商,请参阅 DataGrip 支持

DataGrip 是一个适用于数据库开发人员的集成开发环境 (IDE),它提供查询控制台、架构导航、解释计划、智能代码完成、实时分析和快速修复、重构、版本控制集成以及其他功能。

本文介绍了如何使用本地开发计算机来安装、配置和使用 DataGrip,以使用 Azure DataRicks 中的数据库。

注意

本文已使用 macOS、Databricks JDBC 驱动程序版本 2.6.36 和 DataGrip 版本 2023.3.1 进行了测试。

要求

安装 DataGrip 之前,本地开发计算机必须满足以下要求:

  • Linux、macOS 或 Windows 操作系统。
  • Databricks JDBC 驱动程序下载到本地开发计算机上,从下载的 DatabricksJDBC42-<version>.zip 文件中提取 DatabricksJDBC42.jar 文件。
  • 要与 DataGrip 连接的 Azure Databricks 群集SQL 仓库

步骤 1:安装 DataGrip

下载并安装 DataGrip

  • Linux:下载 .zip 文件,提取其内容,然后按照 Install-Linux-tar.txt 文件中的说明进行操作。
  • macOS:下载并运行 .dmg 文件。
  • Windows:下载并运行 .exe 文件。

有关详细信息,请参阅 DataGrip 网站上的安装 DataGrip

步骤 2:配置用于 DataGrip 的 Databricks JDBC 驱动程序

使用前面下载的 Databricks JDBC 驱动程序的相关信息设置 DataGrip。

  1. 启动 DataGrip。
  2. 单击“文件”>“数据源”。
  3. 在“数据源和驱动程序”对话框中,单击“驱动程序”选项卡。
  4. 单击“ (驱动程序)”按钮来添加驱动程序+
  5. 对于“名称”,请输入 Databricks
  6. 在“常规”选项卡上的“驱动程序文件”列表中,单击“ (添加)”按钮+
  7. 单击“自定义 JAR”。
  8. 通过浏览找到并选择你之前提取的 DatabricksJDBC42.jar 文件,然后单击“打开”。
  9. 对于“类”,请选择 com.databricks.client.jdbc.Driver
  10. 单击“确定”。

步骤 3:将 DataGrip 连接到你的 Azure Databricks 数据库

  1. 在 DataGrip 中,单击“文件”>“数据源”。

  2. 在“数据源”选项卡上,单击“ (添加)”按钮+

  3. 选择在上一步添加的 Databricks 驱动程序。

  4. 在“常规”选项卡上,对于“URL”,请输入你的 Azure Databricks 资源的“JDBC URL”字段的值。 有关 JDBC URL 字段语法,请参阅 Databricks JDBC 驱动程序的身份验证设置

    注意

    必须在 JDBC URL 上指定 ConnCatalog 驱动程序功能设置,否则无法标识架构。

  5. 单击 “测试连接”

    提示

    在测试连接之前,你应当启动你的资源。 否则,测试会在资源启动的同时进行,可能需要几分钟才能完成。

  6. 如果连接成功,请在“架构”选项卡上选中你希望能够访问的架构对应的复选框,例如“所有架构”

  7. 单击“确定”。

针对需要 DataGrip 访问的每个资源,按此步骤中的说明重复操作。

步骤4:使用 DataGrip 来浏览表

使用 DataGrip 访问你的 Azure Databricks 工作区中的表。

  1. 在 DataGrip 的“数据库”窗口中,依次展开你的资源节点、要浏览的架构、“tables”。
  2. 双击某个表。 此时会显示该表中的第一组行。

按此步骤中的说明重复操作,以访问其他表。

若要访问其他架构中的表,请在“数据库”窗口的工具栏中,单击“数据源属性”图标。 在“数据源和驱动程序”对话框中的“架构”选项卡上,选中你要访问的每个其他架构对应的复选框,然后单击“确定”。

步骤 5:使用 DataGrip 运行 SQL 语句

使用 DataGrip 从 samples 目录的 nyctaxi 架构中加载示例 trips 表。

  1. 在 DataGrip 中,单击“文件”>“新建”>“SQL 文件”

  2. 为文件输入一个名称,例如 select_trips

  3. select_trips.sql 文件选项卡中,输入以下 SQL 语句:

    SELECT * FROM samples.nyctaxi.trips;
    
  4. 选择 SELECT 语句。

  5. 在文件选项卡的工具栏上,单击“执行”图标。

后续步骤

其他资源