DataGrip-Integration in Azure Databricks
Hinweis
Dieser Artikel behandelt DataGrip, das von Databricks weder bereitgestellt noch unterstützt wird. Informationen zum Kontaktieren des Anbieters finden Sie unter DataGrip-Support.
DataGrip ist eine integrierte Entwicklungsumgebung (IDE) für Datenbankentwickler, die eine Abfragekonsole, Schemanavigation, Erläuterungspläne, intelligente Codevervollständigung, Echtzeitanalyse und schnelle Fixes, Refactorings, Integration der Versionskontrolle und andere Features bietet.
In diesem Artikel wird beschrieben, wie Sie ihren lokalen Entwicklungscomputer zum Installieren, Konfigurieren und DataGrip verwenden, um in Azure Databricks mit Datenbanken zu arbeiten.
Hinweis
Dieser Artikel wurde mit macOS, dem Databricks-JDBC-Treiber Version 2.6.36 und DataGrip Version 2023.3.1 getestet.
Anforderungen
Vor der Installation von DataGrip muss Ihr lokaler Entwicklungscomputer die folgenden Anforderungen erfüllen:
- Ein Linux-, macOS- oder Windows-Betriebssystem.
- Laden Sie den Databricks JDBC-Treiber auf Ihren lokalen Entwicklungscomputer herunter, und extrahieren Sie die
DatabricksJDBC42.jar
-Datei aus der heruntergeladenenDatabricksJDBC42-<version>.zip
-Datei. - Ein Azure Databricks-Cluster oder SQL-Warehouse, mit dem eine Verbindung mit DataGrip hergestellt werden soll.
Schritt 1: Installieren von DataGrip
Herunterladen und Installieren von DataGrip
- Linux: Laden Sie die Datei
.zip
herunter, extrahieren Sie ihren Inhalt, und befolgen Sie dann die Anweisungen in der DateiInstall-Linux-tar.txt
. - macOS: Laden Sie die Datei
.dmg
herunter, und führen Sie sie aus. - Windows: Laden Sie die Datei
.exe
herunter, und führen Sie sie aus.
Weitere Informationen finden Sie unter Installieren von DataGrip auf der DataGrip-Website.
Schritt 2: Konfigurieren des Databricks JDBC-Treibers für DataGrip
Richten Sie DataGrip mit Informationen zum Databricks JDBC-Treiber ein, den Sie zuvor heruntergeladen haben.
- Starten Sie DataGrip.
- Klicken Sie auf Datei > Datenquellen.
- Klicken Sie im Dialogfeld Datenquellen und Treiber auf die Registerkarte Treiber.
- Klicken Sie auf die Schaltfläche + (Treiber), um einen Treiber hinzuzufügen.
- Geben Sie unter Name
Databricks
ein. - Klicken Sie auf der Registerkarte Allgemein in der Liste Treiberdateien auf die Schaltfläche + (Hinzufügen).
- Klicken Sie auf Benutzerdefinierte JARs.
- Navigieren Sie zu der
DatabricksJDBC42.jar
Datei, die Sie zuvor extrahiert haben, wählen Sie sie aus, und klicken Sie dann auf Öffnen. - Wählen Sie für Klasse die Option
com.databricks.client.jdbc.Driver
aus. - Klicken Sie auf OK.
Schritt 3: Herstellen der Verbindung von DataGrip mit Ihren Azure Databricks-Datenbanken
Klicken Sie in DataGrip auf Datei > Datenquellen.
Klicken Sie auf der Registerkarte Datenquellen auf die Schaltfläche + (Hinzufügen).
Wählen Sie den Databricks-Treiber aus, den Sie im vorherigen Schritt hinzugefügt haben.
Geben Sie auf der Registerkarte Allgemein für URL den Wert aus dem Feld JDBC-URL für Ihre Azure Databricks-Ressource ein. Informationen zur JDBC-URL-Feldsyntax finden Sie unter Authentifizierungseinstellungen für den Databricks JDBC-Treiber.
Hinweis
Die
ConnCatalog
Einstellung für die Treiberfunktion muss auf der URL DES VORGANGS angegeben werden, andernfalls können keine Schemas identifiziert werden.Klicken Sie auf Verbindung testen.
Tipp
Starten Sie Ihre Ressource, bevor Sie Ihre Verbindung testen. Andernfalls kann es einige Minuten dauern, bis der Test abgeschlossen ist, während die Ressource gestartet wird.
Wenn die Verbindung erfolgreich hergestellt wird, aktivieren Sie auf der Registerkarte Schemas die Kontrollkästchen für die Schemas, auf die Sie Zugriff benötigen, z. B. Alle Schemas.
Klicken Sie auf OK.
Wiederholen Sie die Anweisungen in diesem Schritt für jede Ressource, auf die DataGrip zugreifen soll.
Schritt 4: Durchsuchen von Tabellen mithilfe von DataGrip
Zugreifen auf Tabellen in Ihrem in Ihrem Azure Databricks Arbeitsbereich mithilfe von DataGrip.
- Erweitern Sie in DataGrip im Fenster Datenbank Ihren Ressourcenknoten, erweitern Sie das Schema, das Sie durchsuchen möchten, und erweitern Sie dann Tabellen.
- Doppelklicken Sie auf eine Tabelle. Die erste Gruppe von Zeilen aus der Tabelle wird angezeigt.
Wiederholen Sie die Anweisungen in diesem Schritt, um auf zusätzliche Tabellen zu zugreifen.
Klicken Sie auf der Symbolleiste des Fensters Datenbank auf das Symbol Datenquelleneigenschaften, um auf Tabellen in anderen Schemas zu zugreifen. Aktivieren Sie im Dialogfeld Datenquellen und Treiber auf der Registerkarte Schemas das Kontrollkästchen für jedes zusätzliche Schema, auf das Sie zugreifen möchten, und klicken Sie dann auf OK.
Schritt 5: Verwenden von DataGrip zum Ausführen von SQL-Anweisungen
Verwenden Sie DataGrip, um die Beispieltabelle trips
aus dem Schema nyctaxi
des Katalogs samples
zu laden.
Wählen Sie in DataGrip Datei > Neu > SQL-Datei aus.
Geben Sie einen Namen für die Datei ein, z. B.
select_trips
.Geben Sie auf der Registerkarte der Datei
select_trips.sql
die folgende SQL-Anweisung ein:SELECT * FROM samples.nyctaxi.trips;
Wählen Sie die
SELECT
Anweisung aus.Klicken Sie auf der Symbolleiste der Dateiregisterkarte auf das Symbol Ausführen.
Nächste Schritte
- Erfahren Sie mehr über die Abfragekonsole in DataGrip.
- Erfahren Sie mehr über den Daten-Editor in DataGrip.
- Weitere Informationen zu den verschiedenen Toolfenstern finden Sie unter DataGrip.
- Erfahren Sie, wie Sie in DataGrip suchen.
- Erfahren Sie, wie Sie Daten in DataGrip exportieren.
- Erfahren Sie, wie Sie in DataGrip Text mithilfe von regulären Ausdrücken suchen und ersetzen.