Integración de DBeaver con Azure Databricks
Nota:
En este artículo se trata DBeaver, que no se proporciona ni es compatible con Databricks. Para ponerse en contacto con el proveedor, consulte la página Problemas del repositorio dbeaver/dbeaver en GitHub.
DBeaver es una herramienta de base de datos local, multiplataforma para desarrolladores, administradores de bases de datos, analistas de datos, ingenieros de datos y otros usuarios que tienen que trabajar con bases de datos. DBeaver admite Azure Databricks, así como otras bases de datos populares.
En este artículo se describe cómo usar la máquina de desarrollo local para instalar, configurar y usar DBeaver Community Edition (CE), gratuito y de código abierto, para trabajar con bases de datos de Azure Databricks.
Nota:
Este artículo se ha probado con macOS, la versión 2.6.36 del controlador JDBC de Databricks y la versión 23.3.0 de DBeaver CE.
Requisitos
Antes de instalar DBeaver, la máquina de desarrollo local debe cumplir los siguientes requisitos:
- Sistema operativo Linux de 64 bits, macOS o Windows de 64 bits. (Se admite Linux de 32 bits, pero no se recomienda).
- El controlador JDBC de Databricks en la máquina de desarrollo local, con el archivo
DatabricksJDBC42.jar
extraído del archivoDatabricksJDBC42-<version>.zip
descargado.
También debe tener un clúster de Azure Databricks o un almacén de SQL para conectar con DBeaver.
Paso 1: Instalar DBeaver
Descargue e instale DBeaver CE como se muestra a continuación:
- Linux: Descargue y ejecute uno de los instaladores de Linux desde la página Download (Descargar) del sitio web de DBeaver. Las opciones de instalación
snap
yflatpak
también se proporcionan en esta página. - macOS: Use Homebrew para ejecutar
brew install --cask dbeaver-community
o use macPorts para ejecutarsudo port install dbeaver-community
. También hay disponible un instalador de macOS en la página Download (Descargar) del sitio web de DBeaver. - Windows: Use Chocolatey para ejecutar
choco install dbeaver
. También hay disponible un instalador de Windows en la página Download (Descargar) del sitio web de DBeaver.
Paso 2: configuración del controlador JDBC de Azure Databricks para DBeaver
Configure DBeaver con información sobre Databricks JDBC Driver, que descargó anteriormente.
- Inicie DBeaver.
- Si se le pide que cree una base de datos, haga clic en No.
- Si se le pide que se conecte a una base de datos o que seleccione una, haga clic en Cancel (Cancelar).
- Haga clic en Database > Driver Manager (Base de datos > Administrador de controladores).
- En el cuadro de diálogo Driver Manager (Administrador de controladores), haga clic en New (Nuevo).
- En el cuadro de diálogo Create new driver (Crear nuevo controlador), haga clic en la pestaña Libraries (Bibliotecas).
- Haga clic en Agregar archivo.
- Vaya a la carpeta a la que extrajo el controlador JDBC de Azure Databricks.
- Vaya a un nivel inferior para buscar el archivo
.jar
. - Resalte el archivo
.jar
y haga clic en Abrir. - En la pestaña Settings (Configuración), en Driver Name (Nombre del controlador), escriba
Databricks
. - En la pestaña Settings (Configuración), en Class Name (Nombre de la clase), escriba
com.databricks.client.jdbc.Driver
. - Haga clic en Aceptar.
- En el cuadro de diálogo Driver Manager (Administrador de controladores), haga clic en Close (Cerrar).
Paso 3: Conectar DBeaver a las bases de datos de Azure Databricks
Use DBeaver para conectarse al clúster o al almacén de SQL para acceder a las bases de datos del área de trabajo de Azure Databricks.
En DBeaver, haga clic en Database > New Database Connection (Base de datos > Nueva conexión a base de datos).
En el cuadro de diálogo Connect to a database (Conexión a una base de datos), en la pestaña All (Todos), haga clic en Databricks y, a continuación, haga clic en Next (Siguiente).
Haga clic en la pestaña Principal y escriba un valor en el campo URL de JDBC para el recurso de Azure Databricks. Para obtener la sintaxis del campo URL de JDBC, consulte Configuración de la autenticación del controlador JDBC de Databricks.
Haga clic en Probar conexión.
Sugerencia
Debe iniciar el recurso de Azure Databricks antes de probar la conexión. De lo contrario, la prueba puede tardar varios minutos en completarse mientras se inicia el recurso.
Si la conexión se establece correctamente, en el cuadro de diálogo Connection Test (Prueba de conexión), haga clic en OK (Aceptar).
En el cuadro de diálogo Connect to a database (Conexión a una base de datos), haga clic en Finish (Finalizar).
En la ventana Database Navigator (Navegador de bases de datos), se muestra la entrada Databricks. Para cambiar el nombre de la conexión para que sea más fácil identificarla:
- Haga clic con el botón derecho en Databricks y, a continuación, haga clic en Edit connection (Editar conexión).
- En el cuadro de diálogo Connection configuration (Configuración de conexión), haga clic en General.
- En Connection name (Nombre de la conexión), reemplace
Databricks
por otro nombre para la conexión. - Haga clic en Aceptar.
Repita las instrucciones de este paso para cada recurso al que quiera que DBeaver tenga acceso.
Paso 4: Uso de DBeaver para examinar objetos de datos
Utilice DBeaver para acceder a los objetos de datos del área de trabajo de Azure Databricks, como tablas y propiedades de tablas, vistas, índices, tipos de datos y otros tipos de objetos de datos.
En DBeaver, en la ventana Database Navigator (Navegador de bases de datos), haga clic con el botón derecho en la conexión que quiere usar.
Si Connect (Conectar) está habilitado, haga clic allí. (Si Connect [Conectar] está deshabilitado, ya está conectado).
Sugerencia
Debe iniciar el recurso antes de intentar conectarse a él. De lo contrario, la conexión puede tardar varios minutos en completarse mientras se inicia el recurso.
Expanda la conexión a la que acaba de conectarse.
Expanda y examine los objetos de datos disponibles. Haga doble clic en un objeto de datos para obtener más información sobre él.
Repita las instrucciones de este paso para acceder a objetos de datos adicionales.
Paso 5: Usar DBeaver para ejecutar instrucciones SQL
Use DBeaver para cargar la tabla de ejemplo trips
desde el esquema nyctaxi
del catálogo samples
.
En DBeaver, en la ventana Database Navigator (Navegador de bases de datos), haga clic con el botón derecho en la conexión que quiere usar.
Si Connect (Conectar) está habilitado, haga clic allí. (Si Connect [Conectar] está deshabilitado, ya está conectado).
Sugerencia
Debe iniciar el recurso antes de intentar conectarse a él. De lo contrario, la conexión puede tardar varios minutos en completarse mientras se inicia el recurso.
Haga clic en SQL Editor > New SQL Script (Editor SQL > Nuevo script SQL).
En la pestaña (nombre de conexión) Script-1, escriba esta instrucción SQL:
SELECT * FROM samples.nyctaxi.trips;
Haga clic en Editor SQL > Ejecutar script SQL.
Pasos siguientes
- Use el editor de objetos de bases de datos para trabajar con las propiedades, los datos y los diagramas de relación de entidad de los objetos de bases de datos.
- Use el editor de datos para ver y editar datos en una tabla o vista de base de datos.
- Use el editor SQL para trabajar con scripts SQL.
- Trabaje con diagramas de relación de entidad (ERD) en DBeaver.
- Importe y exporte datos desde y hacia DBeaver.
- Migre datos con DBeaver.
- Solucione problemas del controlador JDBC con DBeaver.