Condividi tramite


Integrazione di DBeaver con Azure Databricks

Nota

Questo articolo illustra DBeaver, che non è fornito né supportato da Databricks. Per contattare il provider, vedere la pagina Problemi del repository dbeaver/dbeaver in GitHub.

DBeaver è uno strumento di database locale multipiattaforma per sviluppatori, amministratori di database, analisti dei dati, data engineer e altri utenti che devono lavorare con i database. DBeaver supporta Azure Databricks e altri database più diffusi.

Questo articolo descrive come usare il computer di sviluppo locale per installare, configurare e usare il DBeaver Community Edition (CE) gratuito e open source per lavorare con i database in Azure Databricks.

Nota

Questo articolo è stato testato con macOS, Databricks JDBC Driver versione 2.6.36 e DBeaver CE versione 23.3.0.

Requisiti

Prima di installare DBeaver, il computer di sviluppo locale deve soddisfare i requisiti seguenti:

  • Un sistema operativo Linux a 64 bit, macOS o Windows a 64 bit. (Linux a 32 bit è supportato ma non consigliato).
  • Databricks JDBC Driver nel computer di sviluppo locale, estraendo il DatabricksJDBC42.jar file dal file scaricato DatabricksJDBC42-<version>.zip .

Per connettersi con DBeaver, è anche necessario disporre di un cluster Azure Databricks o di SQL Warehouse.

Passaggio 1: Installare DBeaver

Scaricare e installare DBeaver CE come indicato di seguito:

  • Linux: scaricare ed eseguire uno dei programmi di installazione di Linux dalla pagina Download nel sito Web DBeaver. snap e flatpak le opzioni di installazione sono disponibili anche in questa pagina.
  • macOS: usare Homebrew per eseguire brew install --cask dbeaver-communityo usare MacPorts per eseguire sudo port install dbeaver-community. Un programma di installazione macOS è disponibile anche nella pagina Download del sito Web DBeaver.
  • Windows: usare Chocolatey per eseguire choco install dbeaver. Un programma di installazione di Windows è disponibile anche nella pagina Download del sito Web DBeaver.

Passaggio 2: Configurare il driver JDBC di Azure Databricks per DBeaver

Configurare DBeaver con informazioni sul driver JDBC di Databricks scaricato in precedenza.

  1. Avviare DBeaver.
  2. Se viene richiesto di creare un nuovo database, fare clic su No.
  3. Se viene richiesto di connettersi o selezionare un database, fare clic su Annulla.
  4. Fare clic su Gestione driver di database>.
  5. Nella finestra di dialogo Gestione driver fare clic su Nuovo.
  6. Nella finestra di dialogo Crea nuovo driver fare clic sulla scheda Librerie .
  7. Fare clic su Aggiungi file.
  8. Passare alla cartella in cui è stato estratto il driver JDBC di Azure Databricks.
  9. Passare a un livello inferiore per trovare il .jar file.
  10. Evidenziare il .jar file e fare clic su Apri.
  11. Nella scheda Impostazioni immettere per DatabricksNome driver.
  12. Nella scheda Impostazioni immettere com.databricks.client.jdbc.Driverper Nome classe.
  13. Fare clic su OK.
  14. Nella finestra di dialogo Gestione driver fare clic su Chiudi.

Passaggio 3: Connessione DBeaver ai database di Azure Databricks

Usare DBeaver per connettersi al cluster o a SQL Warehouse per accedere ai database nell'area di lavoro di Azure Databricks.

  1. In DBeaver fare clic su Database > nuovo database Connessione ion.

  2. Nella finestra di dialogo Connessione a un database fare clic su Databricks nella scheda Tutti e quindi su Avanti.

  3. Fare clic sulla scheda Principale e immettere un valore nel campo URL JDBC per la risorsa di Azure Databricks. Per la sintassi del campo URL JDBC, vedere Impostazioni di autenticazione per il driver JDBC di Databricks.

  4. Fare clic su Verifica connessione.

    Suggerimento

    È consigliabile avviare la risorsa di Azure Databricks prima di testare la connessione. In caso contrario, il completamento del test potrebbe richiedere alcuni minuti durante l'avvio della risorsa.

  5. Se la connessione ha esito positivo, nella finestra di dialogo test di Connessione ion fare clic su OK.

  6. Nella finestra di dialogo Connessione a un database fare clic su Fine.

Nella finestra Strumento di navigazione database viene visualizzata una voce di Databricks. Per modificare il nome della connessione per semplificare l'identificazione:

  1. Fare clic con il pulsante destro del mouse su Databricks e quindi scegliere Modifica Connessione ion.
  2. Nella finestra di dialogo di configurazione Connessione ion fare clic su Generale.
  3. Per Connessione nome, sostituire Databricks con un nome diverso per la connessione.
  4. Fare clic su OK.

Ripetere le istruzioni in questo passaggio per ogni risorsa a cui si vuole accedere DBeaver.

Passaggio 4: Usare DBeaver per esplorare gli oggetti dati

Usare DBeaver per accedere agli oggetti dati nell'area di lavoro di Azure Databricks, ad esempio tabelle e proprietà di tabella, viste, indici, tipi di dati e altri tipi di oggetto dati.

  1. In DBeaver fare clic con il pulsante destro del mouse sulla connessione che si desidera utilizzare nella finestra Strumento di navigazione del database .

  2. Se Connessione è abilitato, fare clic su di esso. (Se Connessione è disabilitato, si è già connessi.

    Suggerimento

    È consigliabile avviare la risorsa prima di provare a connettersi. In caso contrario, il completamento della connessione potrebbe richiedere alcuni minuti durante l'avvio della risorsa.

  3. Espandere la connessione a cui si è appena connessi.

  4. Espandere ed esplorare gli oggetti dati disponibili. Fare doppio clic su un oggetto dati per ottenere altre informazioni su di esso.

Ripetere le istruzioni in questo passaggio per accedere ad altri oggetti dati.

Passaggio 5: Usare DBeaver per eseguire istruzioni SQL

Usare DBeaver per caricare la tabella di esempio trips dallo samples schema del nyctaxi catalogo.

  1. In DBeaver fare clic con il pulsante destro del mouse sulla connessione che si desidera utilizzare nella finestra Strumento di navigazione del database .

  2. Se Connessione è abilitato, fare clic su di esso. (Se Connessione è disabilitato, si è già connessi.

    Suggerimento

    È consigliabile avviare la risorsa prima di provare a connettersi. In caso contrario, il completamento della connessione potrebbe richiedere alcuni minuti durante l'avvio della risorsa.

  3. Fare clic su Editor > SQL Nuovo script SQL.

  4. Nella scheda Script-1 (connection-name) immettere questa istruzione SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Fare clic su Sql Editor > Execute SQL script (Esegui script SQL).

Passaggi successivi

  • Utilizzare l'editor di oggetti database per utilizzare diagrammi di relazione tra oggetti di database, dati e relazioni tra entità.
  • Utilizzare l'editor dati per visualizzare e modificare i dati in una tabella o vista di database.
  • Usare l'editor SQL per usare gli script SQL.
  • Usare diagrammi di relazione di entità (ERD) in DBeaver.
  • Importare ed esportare dati in e da DBeaver.
  • Eseguire la migrazione dei dati con DBeaver.
  • Risolvere i problemi del driver JDBC con DBeaver.

Risorse aggiuntive