Partager via


Intégration de DataGrip à Azure Databricks

Notes

Cet article couvre DataGrip, qui n’est ni fourni ni pris en charge par Databricks. Pour contacter le fournisseur, consultez la page Support DataGrip.

DataGrip est un environnement de développement intégré (IDE) pour les développeurs de bases de données qui fournit une console de requête, une navigation dans les schémas, des plans d'explication, une complétion de code intelligente, une analyse en temps réel et des corrections rapides, des remaniements, une intégration du contrôle de version et d'autres fonctionnalités.

Cet article décrit comment utiliser votre machine de développement locale pour installer, configurer et utiliser DataGrip pour travailler avec des bases de données dans Azure Databricks.

Remarque

Cet article a été testé avec macOS, Databricks JDBC Driver version 2.6.36 et DataGrip version 2023.3.1.

Spécifications

Avant d’installer DataGrip, votre ordinateur de développement local doit remplir les conditions suivantes :

  • Un système d’exploitation Linux, macOS ou Windows.
  • Téléchargez le pilote Databricks JDBC sur votre machine de développement locale, en extrayant le DatabricksJDBC42.jarfichier du fichier téléchargéDatabricksJDBC42-<version>.zip.
  • Un cluster Azure Databricks ou un entrepôt SQL auquel connecter DataGrip.

Étape 1 : installer DataGrip

Télécharger et installer DataGrip.

  • Linux: Téléchargez le fichier .zip, extrayez son contenu, puis suivez les instructions dans le fichierInstall-Linux-tar.txt.
  • MacOS: Téléchargez et exécutez le fichier.dmg.
  • Windows: Téléchargez et exécutez le fichier.exe.

Pour plus d’informations, voir installer DataGrip sur le site Web DataGrip.

Étape 2 : configurer le pilote JDBC Databricks pour DataGrip

Configurez DataGrip avec des informations sur le pilote JDBC Databricks que vous avez téléchargé précédemment.

  1. Démarrez DataGrip.
  2. Cliquez sur Fichier> Sources de données.
  3. Dans la boîte de dialogue sources de données et pilotes, cliquez sur l’onglet pilotes.
  4. Cliquez sur le bouton + (Pilote) pour ajouter un pilote.
  5. Pour Nom, entrez Databricks.
  6. Sous l’onglet Général , dans la liste fichiers de pilote, cliquez sur le bouton +(Ajouter).
  7. Cliquez sur fichiers jar personnalisés.
  8. Recherchez et sélectionnez le fichierDatabricksJDBC42.jar que vous avez extrait précédemment, puis cliquez sur Ouvrir.
  9. Pour la classe, sélectionnez com.databricks.client.jdbc.Driver.
  10. Cliquez sur OK.

Étape 3 : Connecter DataGrip à vos bases de données Azure Databricks

  1. Dans DataGrip, cliquez sur Fichier>Source de données.

  2. Sous l’onglet sources de données, cliquez sur le bouton +(Ajouter).

  3. Sélectionnez le pilote Databricks que vous avez ajouté à l’étape précédente.

  4. Sous l’onglet Général, pour URL, entrez la valeur du champ URL JDBC pour votre ressource Azure Databricks. Pour connaître la syntaxe du champ URL JDBC, consultez Paramètres d’authentification pour le pilote JDBC Databricks.

    Remarque

    Le ConnCatalog paramètre de capacité du pilote doit être spécifié sur l’URL JDBC ; sinon, les schémas ne peuvent pas être identifiés.

  5. Cliquez sur Tester la connexion.

    Conseil

    Vous devez démarrer votre ressource avant de tester votre connexion. Dans le cas contraire, le test peut prendre plusieurs minutes pendant le démarrage de la ressource.

  6. Si la connexion réussit, sous l’onglet Schémas, cochez les cases correspondant aux schémas auxquels vous souhaitez pouvoir accéder, par exemple Tous les schémas.

  7. Cliquez sur OK.

Répétez les instructions de cette étape pour chaque ressource à laquelle vous souhaitez que DataGrip accède.

Étape 4 : utiliser DataGrip pour parcourir les tables

Utilisez DataGrip pour accéder aux tables dans votre espace de travail Azure Databricks.

  1. Dans DataGrip, dans la fenêtre Base de données , développez le nœud de votre ressource, développez le schéma que vous souhaitez parcourir, puis développez tables.
  2. Double-cliquer sur un nom de table. Le premier ensemble de lignes de la table s’affiche.

Répétez les instructions de cette étape pour accéder à des tables supplémentaires.

Pour accéder aux tables d’autres schémas, dans la barre d’outils de la fenêtre de base de données, cliquez sur l’icône Propriétés de la source de données. Dans la boîte de dialogue sources de données et pilotes , sous l’onglet schémas, cochez la case correspondant à chaque schéma supplémentaire auquel vous souhaitez accéder, puis cliquez sur OK.

Étape 5 : Utiliser DataGrip pour exécuter des instructions SQL

Utilisez DataGrip pour charger l’exemple de table trips à partir du schéma nyctaxi du catalogue samples.

  1. Dans DataGrip, cliquez sur Fichier > Nouveau > Fichier SQL.

  2. Entrez un nom pour le fichier, par exemple select_trips .

  3. Sous l’onglet de fichier select_trips.sql, entrez l’instruction SQL suivante :

    SELECT * FROM samples.nyctaxi.trips;
    
  4. Sélectionnez l'instruction SELECT.

  5. Dans la barre d’outils de l’onglet fichier, cliquez sur l’icône exécuter.

Étapes suivantes

Ressources supplémentaires