Partager via


Intégration de DBeaver à Azure Databricks

Notes

Cet article couvre DBeaver, qui n’est ni fourni ni pris en charge par Databricks. Pour contacter le fournisseur, utilisez la page Problèmes du dépôt dbeaver/dbeaver sur GitHub.

DBeaver est un outil de base de données multiplateforme local pour les développeurs, les administrateurs de base de données, les analystes de données, les ingénieurs de données et d’autres personnes qui doivent travailler avec des bases de données. DBeaver prend en charge Azure Databricks, ainsi que d’autres bases de données populaires.

Cet article décrit comment utiliser votre machine de développement locale pour installer, configurer et utiliser DBeaver Community Edition (CE), un logiciel gratuit et open source, pour travailler avec des bases de données dans Azure Databricks.

Remarque

Cet article a été testé avec macOS, le pilote JDBC Databricks version 2.6.36 et DBeaver CE version 23.3.0.

Spécifications

Avant d’installer DBeaver, votre ordinateur de développement local doit remplir les conditions suivantes :

  • Un système d’exploitation Linux 64 bits, macOS ou Windows 64 bits. (Linux 32 bits est pris en charge mais non recommandé.)
  • Téléchargez le pilote JDBC Databricks sur votre machine de développement locale, en procédant à l’extraction du fichier DatabricksJDBC42.jar à partir du fichier téléchargé DatabricksJDBC42-<version>.zip.

Vous devez également disposer d’un cluster Azure Databricks ou d’un entrepôt SQL pour se connecter à DBeaver.

Étape 1 : installer DBeaver

Téléchargez et installez DBeaver CE comme suit :

  • Linux: téléchargez et exécutez l’un des programmes d’installation Linux à partir de la page de Téléchargement sur le site Web DBeaver. snap et flatpak les options d’installation sont également fournies sur cette page.
  • macOS: utilisez Homebrew pour exécuter brew install --cask dbeaver-community , ou utilisez MacPortssudo port install dbeaver-community pour exécuter . Un programme d’installation macOS est également disponible à partir de la page de Téléchargement sur le site Web DBeaver.
  • Windows: utilisez le chocolat pour l’exécuter choco install dbeaver . Un programme d'installation pour Windows est également disponible sur la page de téléchargement du site web de DBeaver.

Étape 2 : configurer le pilote JDBC Azure Databricks pour DBeaver

Configurez DBeaver avec des informations sur le pilote JDBC Databricks que vous avez téléchargé précédemment.

  1. Démarrez DBeaver.
  2. Si vous êtes invité à créer une nouvelle base de données, cliquez sur non.
  3. Si vous êtes invité à vous connecter ou à sélectionner une base de données, cliquez sur Annuler.
  4. Cliquez sur Gestionnaire de pilotes> de base de données.
  5. Dans la boîte de dialogue Gestionnaire de pilote , cliquez sur Nouveau.
  6. Dans la boîte de dialogue créer un nouveau pilote , cliquez sur l’onglet bibliothèques .
  7. Cliquez sur Ajouter un fichier.
  8. Accédez au dossier vers lequel vous avez extrait le pilote JDBC Azure Databricks.
  9. Accédez à un niveau inférieur pour rechercher le fichier .jar.
  10. Surlignez le fichier .jar et cliquez sur Ouvrir.
  11. Sous l’onglet Paramètres , pour nom du pilote, entrez Databricks.
  12. Sous l’onglet Paramètres , pour Nom de la classe, entrez com.databricks.client.jdbc.Driver.
  13. Cliquez sur OK.
  14. Dans la boîte de dialogue Gestionnaire de pilote, cliquez sur Fermer.

Étape 3 : Connecter DBeaver à vos bases de données Azure Databricks

Utilisez DBeaver pour vous connecter au cluster ou au dépôt SQL pour accéder aux bases de données dans votre espace de travail Azure Databricks.

  1. Dans DBeaver, cliquez sur base de données >nouvelle connexion à la base de données.

  2. Dans la boîte de dialogue Connecter à une base de données , sous l’onglet tout , cliquez sur Databricks, puis sur suivant.

  3. Cliquez sur l’onglet Principal et entrez une valeur dans le champ URL JDBC de votre Azure Databricks ressource. Pour connaître la syntaxe du champ URL JDBC, consultez Paramètres d’authentification pour le pilote JDBC Databricks.

  4. Cliquez sur Tester la connexion.

    Conseil

    Vous devez démarrer votre ressource Azure Databricks avant de tester votre connexion. Dans le cas contraire, le test peut prendre plusieurs minutes pendant le démarrage de la ressource.

  5. Si la connexion a échoué, dans la boîte de dialogue test de connexion , cliquez sur OK.

  6. Dans la boîte de dialogue Connecter à une base de données , cliquez sur terminer.

Dans la fenêtre Navigateur de base de données, une entrée Databricks s’affiche. Pour modifier le nom de la connexion afin de faciliter l’identification :

  1. Cliquez avec le bouton droit sur Databricks, puis cliquez sur Modifier la connexion.
  2. Dans la boîte de dialogue Configuration de la connexion, cliquez sur Général.
  3. Pour le nom de la connexion, remplacez Databricks par un autre nom pour la connexion.
  4. Cliquez sur OK.

Répétez les instructions de cette étape pour chaque ressource à laquelle vous voulez que DBeaver ait accès.

Étape 4 : utiliser DBeaver pour parcourir les objets de données

Utilisez DBeaver pour accéder aux objets de données dans votre espace de travail Azure Databricks, tels que les tables et les propriétés de table, les vues, les index, les types de données et d’autres types d’objets.

  1. Dans DBeaver, dans la fenêtre navigateur de base de données , cliquez avec le bouton droit sur la connexion que vous souhaitez utiliser.

  2. Si Connecter est activé, cliquez dessus. (si Connecter est désactivé, vous êtes déjà connecté.)

    Conseil

    Vous devez démarrer votre ressource avant d’essayer de vous y connecter. Sinon, la connexion peut prendre plusieurs minutes pendant le démarrage de la ressource.

  3. Développez la connexion à laquelle vous venez de vous connecter.

  4. Développez et parcourez les objets de données disponibles. Double-cliquez sur un objet de données pour obtenir plus d’informations sur celui-ci.

Répétez les instructions de cette étape pour accéder à des objets de données supplémentaires.

Étape 5 : Utiliser DBeaver pour exécuter des instructions SQL

Utilisez DBeaver pour charger l’exemple de table trips à partir du schéma nyctaxi du catalogue samples.

  1. Dans DBeaver, dans la fenêtre navigateur de base de données , cliquez avec le bouton droit sur la connexion que vous souhaitez utiliser.

  2. Si Connecter est activé, cliquez dessus. (si Connecter est désactivé, vous êtes déjà connecté.)

    Conseil

    Vous devez démarrer votre ressource avant d’essayer de vous y connecter. Sinon, la connexion peut prendre plusieurs minutes pendant le démarrage de la ressource.

  3. cliquez sur éditeur de SQL> nouveau SQL Script.

  4. Sous l’onglet Script-1 (nom de connexion), entrez cette instruction :

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Cliquez sur Éditeur SQL > Exécuter le script SQL.

Étapes suivantes

Ressources supplémentaires