Intégration de DataGrip à Azure Databricks
Notes
Cet article couvre DataGrip, qui n’est ni fourni ni pris en charge par Databricks. Pour contacter le fournisseur, consultez la page Support DataGrip.
DataGrip est un environnement de développement intégré (IDE) pour les développeurs de bases de données qui fournit une console de requête, une navigation dans les schémas, des plans d'explication, une complétion de code intelligente, une analyse en temps réel et des corrections rapides, des remaniements, une intégration du contrôle de version et d'autres fonctionnalités.
Cet article décrit comment utiliser votre machine de développement locale pour installer, configurer et utiliser DataGrip pour travailler avec des bases de données dans Azure Databricks.
Remarque
Cet article a été testé avec macOS, Databricks JDBC Driver version 2.6.36 et DataGrip version 2023.3.1.
Spécifications
Avant d’installer DataGrip, votre ordinateur de développement local doit remplir les conditions suivantes :
- Un système d’exploitation Linux, macOS ou Windows.
- Téléchargez le pilote Databricks JDBC sur votre machine de développement locale, en extrayant le
DatabricksJDBC42.jar
fichier du fichier téléchargéDatabricksJDBC42-<version>.zip
. - Un cluster Azure Databricks ou un entrepôt SQL auquel connecter DataGrip.
Étape 1 : installer DataGrip
Télécharger et installer DataGrip.
- Linux: Téléchargez le fichier
.zip
, extrayez son contenu, puis suivez les instructions dans le fichierInstall-Linux-tar.txt
. - MacOS: Téléchargez et exécutez le fichier
.dmg
. - Windows: Téléchargez et exécutez le fichier
.exe
.
Pour plus d’informations, voir installer DataGrip sur le site Web DataGrip.
Étape 2 : configurer le pilote JDBC Databricks pour DataGrip
Configurez DataGrip avec des informations sur le pilote JDBC Databricks que vous avez téléchargé précédemment.
- Démarrez DataGrip.
- Cliquez sur Fichier> Sources de données.
- Dans la boîte de dialogue sources de données et pilotes, cliquez sur l’onglet pilotes.
- Cliquez sur le bouton + (Pilote) pour ajouter un pilote.
- Pour Nom, entrez
Databricks
. - Sous l’onglet Général , dans la liste fichiers de pilote, cliquez sur le bouton +(Ajouter).
- Cliquez sur fichiers jar personnalisés.
- Recherchez et sélectionnez le fichier
DatabricksJDBC42.jar
que vous avez extrait précédemment, puis cliquez sur Ouvrir. - Pour la classe, sélectionnez
com.databricks.client.jdbc.Driver
. - Cliquez sur OK.
Étape 3 : Connecter DataGrip à vos bases de données Azure Databricks
Dans DataGrip, cliquez sur Fichier>Source de données.
Sous l’onglet sources de données, cliquez sur le bouton +(Ajouter).
Sélectionnez le pilote Databricks que vous avez ajouté à l’étape précédente.
Sous l’onglet Général, pour URL, entrez la valeur du champ URL JDBC pour votre ressource Azure Databricks. Pour connaître la syntaxe du champ URL JDBC, consultez Paramètres d’authentification pour le pilote JDBC Databricks.
Remarque
Le
ConnCatalog
paramètre de capacité du pilote doit être spécifié sur l’URL JDBC ; sinon, les schémas ne peuvent pas être identifiés.Cliquez sur Tester la connexion.
Conseil
Vous devez démarrer votre ressource avant de tester votre connexion. Dans le cas contraire, le test peut prendre plusieurs minutes pendant le démarrage de la ressource.
Si la connexion réussit, sous l’onglet Schémas, cochez les cases correspondant aux schémas auxquels vous souhaitez pouvoir accéder, par exemple Tous les schémas.
Cliquez sur OK.
Répétez les instructions de cette étape pour chaque ressource à laquelle vous souhaitez que DataGrip accède.
Étape 4 : utiliser DataGrip pour parcourir les tables
Utilisez DataGrip pour accéder aux tables dans votre espace de travail Azure Databricks.
- Dans DataGrip, dans la fenêtre Base de données , développez le nœud de votre ressource, développez le schéma que vous souhaitez parcourir, puis développez tables.
- Double-cliquer sur un nom de table. Le premier ensemble de lignes de la table s’affiche.
Répétez les instructions de cette étape pour accéder à des tables supplémentaires.
Pour accéder aux tables d’autres schémas, dans la barre d’outils de la fenêtre de base de données, cliquez sur l’icône Propriétés de la source de données. Dans la boîte de dialogue sources de données et pilotes , sous l’onglet schémas, cochez la case correspondant à chaque schéma supplémentaire auquel vous souhaitez accéder, puis cliquez sur OK.
Étape 5 : Utiliser DataGrip pour exécuter des instructions SQL
Utilisez DataGrip pour charger l’exemple de table trips
à partir du schéma nyctaxi
du catalogue samples
.
Dans DataGrip, cliquez sur Fichier > Nouveau > Fichier SQL.
Entrez un nom pour le fichier, par exemple
select_trips
.Sous l’onglet de fichier
select_trips.sql
, entrez l’instruction SQL suivante :SELECT * FROM samples.nyctaxi.trips;
Sélectionnez l'instruction
SELECT
.Dans la barre d’outils de l’onglet fichier, cliquez sur l’icône exécuter.
Étapes suivantes
- En savoir plus sur la console de requête dans DataGrip.
- En savoir plus sur l' éditeur de données dans DataGrip.
- En savoir plus sur les différentes fenêtres outil dans DataGrip.
- Découvrez comment effectuer des recherches dans DataGrip.
- Découvrez comment exporter des données dans DataGrip.
- Découvrez comment Rechercher et remplacer du texte à l’aide d’expressions régulières dans DataGrip.