Partager via


Intégration de DBeaver à Azure Databricks

Remarque

Cet article traite de DBeaver, développé par un tiers. Pour contacter le fournisseur, consultez la page problèmes du référentiel dbeaver/dbeaver sur GitHub.

DBeaver est un outil local de base de données multiplateforme pour les développeurs, les administrateurs de base de données, les analystes de données, les ingénieurs données et d’autres personnes qui doivent travailler avec des bases de données. DBeaver prend en charge Azure Databricks ainsi que d’autres bases de données populaires.

Cet article explique comment utiliser votre ordinateur de développement local pour installer, configurer et utiliser l’édition gratuite DBeaver Community Edition (CE) open source pour utiliser des bases de données dans Azure Databricks.

Remarque

Cet article a été testé avec macOS, Databricks JDBC Driver version 2.6.36 et DBeaver CE version 23.3.0.

Spécifications

Avant d’installer DBeaver, votre ordinateur de développement local doit répondre aux exigences suivantes :

  • Un système d’exploitation Linux 64 bits, macOS ou Windows 64 bits. (Linux 32 bits est pris en charge, mais non recommandé.)
  • Installez le pilote JDBC Databricks sur votre ordinateur de développement local, en extrayant le fichier DatabricksJDBC42.jar à partir du fichier DatabricksJDBC42-<version>.zip téléchargé.

Vous devez également disposer d’un cluster Azure Databricks ou d’un entrepôt SQL pour vous connecter à DBeaver.

Étape 1 : Installer DBeaver

Téléchargez et installez DBeaver CE comme suit :

  • Linux : Téléchargez et exécutez l’un des programmes d’installation Linux à partir de la page téléchargement sur le site web DBeaver. snap et flatpak les options d’installation sont également fournies sur cette page.
  • macOS : Utilisez Homebrew pour exécuter brew install --cask dbeaver-community, ou utilisez MacPorts pour exécuter sudo port install dbeaver-community. Un programme d’installation macOS est également disponible à partir de la page de téléchargement sur le site web DBeaver.
  • Windows : Utilisez Chocolatey pour exécuter choco install dbeaver. Un programme d’installation Windows est également disponible à partir de la page de téléchargement sur le site web DBeaver.

Étape 2 : Configurer le pilote JDBC Azure Databricks pour DBeaver

Configurez DBeaver avec des informations sur le pilote JDBC Databricks que vous avez téléchargé précédemment.

  1. Démarrez DBeaver.
  2. Si vous êtes invité à créer une base de données, cliquez sur Non.
  3. Si vous êtes invité à vous connecter ou à sélectionner une base de données, cliquez sur Annuler.
  4. Cliquez sur Gestionnaire de pilotes de base de données>.
  5. Dans la boîte de dialogue Gestionnaire de pilotes , cliquez sur Nouveau.
  6. Dans la boîte de dialogue Créer un pilote , cliquez sur l’onglet Bibliothèques .
  7. Cliquez sur Ajouter un fichier.
  8. Accédez au dossier dans lequel vous avez extrait le pilote JDBC Azure Databricks.
  9. Accédez à un niveau inférieur pour rechercher le .jar fichier.
  10. Mettez en surbrillance le .jar fichier, puis cliquez sur Ouvrir.
  11. Sous l’onglet Paramètres , pour le nom du pilote, entrez Databricks.
  12. Sous l’onglet Paramètres , pour nom de la classe, entrez com.databricks.client.jdbc.Driver.
  13. Cliquez sur OK.
  14. Dans la boîte de dialogue Gestionnaire de pilotes , cliquez sur Fermer.

Étape 3 : Connecter DBeaver à vos bases de données Azure Databricks

Utilisez DBeaver pour vous connecter au cluster ou à l’entrepôt SQL pour accéder aux bases de données de votre espace de travail Azure Databricks.

  1. Dans DBeaver, cliquez sur Base de données > Nouvelle connexion de base de données.

  2. Dans la boîte de dialogue Se connecter à une base de données , sous l’onglet Tout , cliquez sur Databricks, puis sur Suivant.

  3. Cliquez sur l’onglet Principal et entrez une valeur dans le champ URL JDBC de votre ressource Azure Databricks. Pour connaître la syntaxe du champ URL JDBC, consultez Paramètres d’authentification pour le pilote JDBC Databricks.

  4. Cliquez sur Tester la connexion.

    Conseil / Astuce

    Vous devez démarrer votre ressource Azure Databricks avant de tester votre connexion. Dans le cas contraire, le test peut prendre plusieurs minutes pendant le démarrage de la ressource.

  5. Si la connexion réussit, dans la boîte de dialogue Test de connexion, cliquez sur OK.

  6. Dans la boîte de dialogue Se connecter à une base de données , cliquez sur Terminer.

Dans la fenêtre Navigateur de base de données , une entrée Databricks s’affiche. Pour modifier le nom de la connexion pour faciliter l’identification :

  1. Cliquez avec le bouton droit sur Databricks, puis cliquez sur Modifier la connexion.
  2. Dans la boîte de dialogue Configuration de la connexion , cliquez sur Général.
  3. Pour le nom de la connexion, remplacez-le Databricks par un autre nom pour la connexion.
  4. Cliquez sur OK.

Répétez les instructions de cette étape pour chaque ressource que vous souhaitez que DBeaver accède.

Étape 4 : Utiliser DBeaver pour parcourir les objets de données

Utilisez DBeaver pour accéder aux objets de données dans votre espace de travail Azure Databricks, tels que les tables et les propriétés de table, les vues, les index, les types de données et d’autres types d’objets de données.

  1. Dans DBeaver, dans la fenêtre Navigateur de base de données , cliquez avec le bouton droit sur la connexion que vous souhaitez utiliser.

  2. Si La connexion est activée, cliquez dessus. (Si La connexion est désactivée, vous êtes déjà connecté.)

    Conseil / Astuce

    Vous devez démarrer votre ressource avant d’essayer de vous y connecter. Sinon, la connexion peut prendre plusieurs minutes pendant le démarrage de la ressource.

  3. Développez la connexion à laquelle vous venez de vous connecter.

  4. Étendez et parcourez les objets de données disponibles. Double-cliquez sur un objet de données pour obtenir plus d’informations sur celui-ci.

Répétez les instructions de cette étape pour accéder à des objets de données supplémentaires.

Étape 5 : Utiliser DBeaver pour exécuter des instructions SQL

Utilisez DBeaver pour charger l'exemple de table trips depuis le catalogue samples du schéma nyctaxi.

  1. Dans DBeaver, dans la fenêtre Navigateur de base de données , cliquez avec le bouton droit sur la connexion que vous souhaitez utiliser.

  2. Si La connexion est activée, cliquez dessus. (Si La connexion est désactivée, vous êtes déjà connecté.)

    Conseil / Astuce

    Vous devez démarrer votre ressource avant d’essayer de vous y connecter. Sinon, la connexion peut prendre plusieurs minutes pendant le démarrage de la ressource.

  3. Cliquez sur Nouveau script SQL de l’éditeur > SQL.

  4. Sous l’onglet Script-1 (nom de connexion), entrez cette instruction SQL :

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Cliquez sur Éditeur SQL > pour exécuter le script SQL.

Étapes suivantes

Ressources supplémentaires