DBeaver-integrering med Azure Databricks

Kommentar

Den här artikeln beskriver DBeaver, som varken tillhandahålls eller stöds av Databricks. Information om hur du kontaktar providern finns på sidan Problem för lagringsplatsen dbeaver/dbeaver på GitHub.

DBeaver är ett lokalt databasverktyg för flera plattformar för utvecklare, databasadministratörer, dataanalytiker, datatekniker och andra som behöver arbeta med databaser. DBeaver stöder Både Azure Databricks och andra populära databaser.

Den här artikeln beskriver hur du använder din lokala utvecklingsdator för att installera, konfigurera och använda den kostnadsfria öppen källkod DBeaver Community Edition (CE) för att arbeta med databaser i Azure Databricks.

Kommentar

Den här artikeln har testats med macOS, Databricks JDBC Driver version 2.6.36 och DBeaver CE version 23.3.0.

Krav

Innan du installerar DBeaver måste den lokala utvecklingsdatorn uppfylla följande krav:

  • Ett 64-bitars Linux-, macOS- eller Windows 64-bitars operativsystem. (Linux 32-bitars stöds men rekommenderas inte.)
  • Databricks JDBC-drivrutinen till din lokala utvecklingsdator och extrahera DatabricksJDBC42.jar filen från den nedladdade DatabricksJDBC42-<version>.zip filen.

Du måste också ha ett Azure Databricks-kluster eller SQL-lager för att kunna ansluta till DBeaver.

Steg 1: Installera DBeaver

Ladda ned och installera DBeaver CE enligt följande:

  • Linux: Ladda ned och kör en av Linux-installationsprogrammet från nedladdningssidan på DBeaver-webbplatsen. snap och flatpak installationsalternativ finns även på den här sidan.
  • macOS: Använd Homebrew för att köra brew install --cask dbeaver-communityeller använd MacPorts för att köra sudo port install dbeaver-community. Ett macOS-installationsprogram finns också på sidan Ladda ned på DBeaver-webbplatsen.
  • Windows: Använd Chocolatey för att köra choco install dbeaver. Ett Windows-installationsprogram finns också på sidan Ladda ned på DBeaver-webbplatsen.

Steg 2: Konfigurera Azure Databricks JDBC-drivrutinen för DBeaver

Konfigurera DBeaver med information om Databricks JDBC-drivrutinen som du laddade ned tidigare.

  1. Starta DBeaver.
  2. Om du uppmanas att skapa en ny databas klickar du på Nej.
  3. Om du uppmanas att ansluta till eller välja en databas klickar du på Avbryt.
  4. Klicka på Databasdrivrutinshanteraren>.
  5. I dialogrutan Drivrutinshanterare klickar du på Ny.
  6. I dialogrutan Skapa ny drivrutin klickar du på fliken Bibliotek.
  7. Klicka på Lägg till fil.
  8. Navigera till mappen som du extraherade Azure Databricks JDBC-drivrutinen till.
  9. Navigera en nivå lägre för att hitta .jar filen.
  10. .jar Markera filen och klicka på Öppna.
  11. På fliken Inställningar anger du Databricksför Drivrutinsnamn .
  12. På fliken Inställningar anger du com.databricks.client.jdbc.Driverför Klassnamn .
  13. Klicka på OK.
  14. I dialogrutan Drivrutinshanteraren klickar du på Stäng.

Steg 3: Anslut DBeaver till dina Azure Databricks-databaser

Använd DBeaver för att ansluta till klustret eller SQL-lagret för att få åtkomst till databaserna på din Azure Databricks-arbetsyta.

  1. I DBeaver klickar du på Databas > ny databas Anslut ion.

  2. I dialogrutan Anslut till en databas klickar du på Databricksfliken Alla och klickar sedan på Nästa.

  3. Klicka på fliken Main och ange ett värde i fältet JDBC URL för din Azure Databricks-resurs. Fältsyntax för JDBC-URL finns i Autentiseringsinställningar för Databricks JDBC-drivrutinen.

  4. Klicka på Testa anslutning.

    Dricks

    Du bör starta din Azure Databricks-resurs innan du testar anslutningen. Annars kan det ta flera minuter att slutföra testet medan resursen startar.

  5. Om anslutningen lyckas klickar du på OK i dialogrutan Anslut ionstest.

  6. I dialogrutan Anslut till en databas klickar du på Slutför.

I fönstret Databasnavigering visas en Databricks-post . Så här ändrar du anslutningens namn så att det blir lättare att identifiera:

  1. Högerklicka på Databricks och klicka sedan på Redigera Anslut ion.
  2. I dialogrutan Anslut ion-konfiguration klickar du på Allmänt.
  3. Ersätt med ett annat namn för anslutningen för Anslut ionsnamnDatabricks.
  4. Klicka på OK.

Upprepa anvisningarna i det här steget för varje resurs som du vill att DBeaver ska komma åt.

Steg 4: Använd DBeaver för att bläddra bland dataobjekt

Använd DBeaver för att komma åt dataobjekt på din Azure Databricks-arbetsyta, till exempel tabeller och tabellegenskaper, vyer, index, datatyper och andra typer av dataobjekt.

  1. Högerklicka på den anslutning som du vill använda i fönstret Databasnavigering i DBeaver.

  2. Om Anslut är aktiverat klickar du på det. (Om Anslut är inaktiverad är du redan ansluten.)

    Dricks

    Du bör starta resursen innan du försöker ansluta till den. Annars kan det ta flera minuter att slutföra anslutningen medan resursen startas.

  3. Expandera den anslutning som du just har anslutit till.

  4. Expandera och bläddra bland tillgängliga dataobjekt. Dubbelklicka på ett dataobjekt för att få mer information om det.

Upprepa anvisningarna i det här steget för att få åtkomst till ytterligare dataobjekt.

Steg 5: Använd DBeaver för att köra SQL-instruktioner

Använd DBeaver för att läsa in exempeltabellen tripssamples från katalogens nyctaxi schema.

  1. Högerklicka på den anslutning som du vill använda i fönstret Databasnavigering i DBeaver.

  2. Om Anslut är aktiverat klickar du på det. (Om Anslut är inaktiverad är du redan ansluten.)

    Dricks

    Du bör starta resursen innan du försöker ansluta till den. Annars kan det ta flera minuter att slutföra anslutningen medan resursen startas.

  3. Klicka på SQL-redigeraren > Nytt SQL-skript.

  4. På fliken (anslutningsnamn) Script-1 anger du den här SQL-instruktionen:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Klicka på SQL-redigeraren > Kör SQL-skript.

Nästa steg

Ytterligare resurser