Compartir vía


Integración de DBeaver con Azure Databricks

Nota:

En este artículo se trata DBeaver, que no se proporciona ni es compatible con Databricks. Para ponerse en contacto con el proveedor, consulte la página Problemas del repositorio dbeaver/dbeaver en GitHub.

DBeaver es una herramienta de base de datos local, multiplataforma para desarrolladores, administradores de bases de datos, analistas de datos, ingenieros de datos y otros usuarios que tienen que trabajar con bases de datos. DBeaver admite Azure Databricks, así como otras bases de datos populares.

En este artículo se describe cómo usar la máquina de desarrollo local para instalar, configurar y usar DBeaver Community Edition (CE), gratuito y de código abierto, para trabajar con bases de datos de Azure Databricks.

Nota:

Este artículo se ha probado con macOS, la versión 2.6.36 del controlador JDBC de Databricks y la versión 23.3.0 de DBeaver CE.

Requisitos

Antes de instalar DBeaver, la máquina de desarrollo local debe cumplir los siguientes requisitos:

  • Sistema operativo Linux de 64 bits, macOS o Windows de 64 bits. (Se admite Linux de 32 bits, pero no se recomienda).
  • El controlador JDBC de Databricks en la máquina de desarrollo local, con el archivo DatabricksJDBC42.jar extraído del archivo DatabricksJDBC42-<version>.zip descargado.

También debe tener un clúster de Azure Databricks o un almacén de SQL para conectar con DBeaver.

Paso 1: Instalar DBeaver

Descargue e instale DBeaver CE como se muestra a continuación:

  • Linux: Descargue y ejecute uno de los instaladores de Linux desde la página Download (Descargar) del sitio web de DBeaver. Las opciones de instalación snap y flatpak también se proporcionan en esta página.
  • macOS: Use Homebrew para ejecutar brew install --cask dbeaver-community o use macPorts para ejecutar sudo port install dbeaver-community. También hay disponible un instalador de macOS en la página Download (Descargar) del sitio web de DBeaver.
  • Windows: Use Chocolatey para ejecutar choco install dbeaver. También hay disponible un instalador de Windows en la página Download (Descargar) del sitio web de DBeaver.

Paso 2: configuración del controlador JDBC de Azure Databricks para DBeaver

Configure DBeaver con información sobre Databricks JDBC Driver, que descargó anteriormente.

  1. Inicie DBeaver.
  2. Si se le pide que cree una base de datos, haga clic en No.
  3. Si se le pide que se conecte a una base de datos o que seleccione una, haga clic en Cancel (Cancelar).
  4. Haga clic en Database > Driver Manager (Base de datos > Administrador de controladores).
  5. En el cuadro de diálogo Driver Manager (Administrador de controladores), haga clic en New (Nuevo).
  6. En el cuadro de diálogo Create new driver (Crear nuevo controlador), haga clic en la pestaña Libraries (Bibliotecas).
  7. Haga clic en Agregar archivo.
  8. Vaya a la carpeta a la que extrajo el controlador JDBC de Azure Databricks.
  9. Vaya a un nivel inferior para buscar el archivo .jar.
  10. Resalte el archivo .jar y haga clic en Abrir.
  11. En la pestaña Settings (Configuración), en Driver Name (Nombre del controlador), escriba Databricks.
  12. En la pestaña Settings (Configuración), en Class Name (Nombre de la clase), escriba com.databricks.client.jdbc.Driver.
  13. Haga clic en Aceptar.
  14. En el cuadro de diálogo Driver Manager (Administrador de controladores), haga clic en Close (Cerrar).

Paso 3: Conectar DBeaver a las bases de datos de Azure Databricks

Use DBeaver para conectarse al clúster o al almacén de SQL para acceder a las bases de datos del área de trabajo de Azure Databricks.

  1. En DBeaver, haga clic en Database > New Database Connection (Base de datos > Nueva conexión a base de datos).

  2. En el cuadro de diálogo Connect to a database (Conexión a una base de datos), en la pestaña All (Todos), haga clic en Databricks y, a continuación, haga clic en Next (Siguiente).

  3. Haga clic en la pestaña Principal y escriba un valor en el campo URL de JDBC para el recurso de Azure Databricks. Para obtener la sintaxis del campo URL de JDBC, consulte Configuración de la autenticación del controlador JDBC de Databricks.

  4. Haga clic en Probar conexión.

    Sugerencia

    Debe iniciar el recurso de Azure Databricks antes de probar la conexión. De lo contrario, la prueba puede tardar varios minutos en completarse mientras se inicia el recurso.

  5. Si la conexión se establece correctamente, en el cuadro de diálogo Connection Test (Prueba de conexión), haga clic en OK (Aceptar).

  6. En el cuadro de diálogo Connect to a database (Conexión a una base de datos), haga clic en Finish (Finalizar).

En la ventana Database Navigator (Navegador de bases de datos), se muestra la entrada Databricks. Para cambiar el nombre de la conexión para que sea más fácil identificarla:

  1. Haga clic con el botón derecho en Databricks y, a continuación, haga clic en Edit connection (Editar conexión).
  2. En el cuadro de diálogo Connection configuration (Configuración de conexión), haga clic en General.
  3. En Connection name (Nombre de la conexión), reemplace Databricks por otro nombre para la conexión.
  4. Haga clic en Aceptar.

Repita las instrucciones de este paso para cada recurso al que quiera que DBeaver tenga acceso.

Paso 4: Uso de DBeaver para examinar objetos de datos

Utilice DBeaver para acceder a los objetos de datos del área de trabajo de Azure Databricks, como tablas y propiedades de tablas, vistas, índices, tipos de datos y otros tipos de objetos de datos.

  1. En DBeaver, en la ventana Database Navigator (Navegador de bases de datos), haga clic con el botón derecho en la conexión que quiere usar.

  2. Si Connect (Conectar) está habilitado, haga clic allí. (Si Connect [Conectar] está deshabilitado, ya está conectado).

    Sugerencia

    Debe iniciar el recurso antes de intentar conectarse a él. De lo contrario, la conexión puede tardar varios minutos en completarse mientras se inicia el recurso.

  3. Expanda la conexión a la que acaba de conectarse.

  4. Expanda y examine los objetos de datos disponibles. Haga doble clic en un objeto de datos para obtener más información sobre él.

Repita las instrucciones de este paso para acceder a objetos de datos adicionales.

Paso 5: Usar DBeaver para ejecutar instrucciones SQL

Use DBeaver para cargar la tabla de ejemplo trips desde el esquema nyctaxi del catálogo samples.

  1. En DBeaver, en la ventana Database Navigator (Navegador de bases de datos), haga clic con el botón derecho en la conexión que quiere usar.

  2. Si Connect (Conectar) está habilitado, haga clic allí. (Si Connect [Conectar] está deshabilitado, ya está conectado).

    Sugerencia

    Debe iniciar el recurso antes de intentar conectarse a él. De lo contrario, la conexión puede tardar varios minutos en completarse mientras se inicia el recurso.

  3. Haga clic en SQL Editor > New SQL Script (Editor SQL > Nuevo script SQL).

  4. En la pestaña (nombre de conexión) Script-1, escriba esta instrucción SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Haga clic en Editor SQL > Ejecutar script SQL.

Pasos siguientes

Recursos adicionales