Partekatu bidez


Controlador JDBC de Databricks

Nota:

El código fuente del controlador JDBC de Databricks está disponible públicamente en la licencia de Apache 2.0.

Esto refleja el compromiso de Databricks con la transparencia, la colaboración y el poder del desarrollo basado en la comunidad. Las contribuciones de desarrolladores, usuarios y la comunidad son bienvenidos. Para empezar, consulte las Directrices de contribución.

El controlador JDBC de Databricks permite conectar herramientas como DataGrip, DBeaver y SQL Workbench/J a Azure Databricks a través de Java Database Connectivity (JDBC), una especificación estándar del sector para acceder a los sistemas de administración de bases de datos.

Este controlador ha implementado las API de JDBC y proporciona otras funciones básicas como OAuth, Cloud Fetch y características como la ingesta de volúmenes de Unity Catalog. Ejecuta en modo de consulta nativo y admite consultas parametrizadas nativas, y puede ejecutarse utilizando las APIs de Ejecución de Sentencias, que ofrecen la característica beneficiosa de retención de resultados de consulta, o con Thrift.

Nota:

En los sistemas operativos IBM AIX, no se admite el formato de resultado de Apache Arrow. Dado que Cloud Fetch se basa en Arrow, Cloud Fetch tampoco se admite en AIX. Para evitar errores durante la ejecución de SQL, deshabilite Arrow estableciendo la propiedad de conexión JDBC: EnableArrow=0

En este artículo se proporciona información sobre cómo instalar y usar databricks JDBC Driver, versión 3 y posteriores. Para obtener información sobre el controlador JDBC de Databricks (Simba), a continuación de la versión 3, consulte Databricks JDBC Driver (Simba).

Requisitos

Para usar el controlador JDBC de Databricks, se deben cumplir los siguientes requisitos:

  • Java Runtime Environment (JRE) 11.0 o superior. Las pruebas de CI se admiten en JRE 11, 17 y 21.

Hay disponible una rama JDK 8 dedicada para los usuarios que requieren compatibilidad con Java 8. Los usuarios pueden compilar un ARCHIVO JAR desde esta rama según sea necesario. Esta rama se sincroniza periódicamente con la rama principal, pero las contribuciones de la comunidad son bienvenidas para mantenerla actualizada. Consulte rama JDK 8 del controlador JDBC de Databricks.

Nota:

Como resultado de un cambio en JDK 16 que provocó un problema de compatibilidad con la biblioteca apache Arrow usada por el controlador JDBC, pueden producirse errores en tiempo de ejecución al usar el controlador JDBC con JDK 16 o superior. Para evitar estos errores, reinicie la aplicación o el controlador mediante la siguiente opción de comando de JVM:

--add-opens=java.base/java.nio=org.apache.arrow.memory.core ALL-UNNAMED

Instalar el controlador

El controlador JDBC de Databricks se publica en el repositorio de Maven.

Para instalar el controlador, puede realizar cualquiera de las acciones siguientes:

  • Para los proyectos de Maven, agregue la siguiente dependencia al archivo del pom.xml proyecto para indicar a Maven que descargue automáticamente el controlador JDBC con la versión especificada:

    <dependency>
      <groupId>com.databricks</groupId>
      <artifactId>databricks-jdbc</artifactId>
      <version>3.0.5</version>
      <scope>runtime</scope>
    </dependency>
    
  • En el caso de los proyectos de Gradle, agregue la siguiente dependencia al archivo de compilación del proyecto para indicar a Gradle que descargue automáticamente el controlador JDBC con la versión especificada:

    implementation 'com.databricks:databricks-jdbc:3.0.5'
    

Para ver la sintaxis de dependencia de otros tipos de proyecto y obtener el número de versión más reciente del controlador JDBC de Databricks, consulte el repositorio de Maven.

Pasos siguientes

Recursos adicionales