Bagikan melalui


Integrasi DBeaver dengan Azure Databricks

Catatan

Artikel ini membahas DBeaver yang tidak disediakan atau didukung oleh Databricks. Untuk menghubungi penyedia, harap lihat halaman Masalah dari repo dbeaver/dbeaver pada GitHub.

DBeaver adalah alat database multi-platform lokal untuk pengembang, administrator database, analis data, insinyur data, dan lainnya yang perlu bekerja dengan database. DBeaver mendukung Azure Databricks serta database populer lainnya.

Artikel ini menjelaskan cara menggunakan mesin pengembangan lokal untuk menginstal, mengonfigurasi, dan menggunakan DBeaver Community Edition (CE) untuk bekerja dengan database di Azure Databricks.

Catatan

Artikel ini diuji dengan macOS, Driver Databricks JDBC versi 2.6.36, dan DBeaver CE versi 23.3.0.

Persyaratan

Sebelum Anda menginstal DBeaver, mesin pengembangan lokal Anda harus memenuhi persyaratan berikut:

  • Sistem operasi Linux 64-bit, macOS, atau Windows 64-bit. (Linux 32-bit didukung tetapi tidak direkomendasikan.)
  • Unduh Driver Databricks JDBC ke mesin pengembangan lokal Anda, lalu ekstrak file DatabricksJDBC42.jar dari file DatabricksJDBC42-<version>.zip yang diunduh.

Anda juga harus memiliki kluster Azure Databricks atau gudang SQL untuk terhubung dengan DBeaver.

Langkah 1: Instal DBeaver

Unduh dan instal DBeaver CE sebagai berikut:

  • Linux: Unduh dan jalankan salah satu penginstal Linux dari halaman Unduh di situs web DBeaver. Opsi instalasi snap dan flatpak juga disediakan di halaman ini.
  • macOS: Gunakan Homebrew untuk menjalankan brew install --cask dbeaver-community, atau gunakan MacPorts untuk menjalankan sudo port install dbeaver-community. Penginstal macOS juga tersedia dari halaman Unduh di situs web DBeaver.
  • Windows: Gunakan Chocolatey untuk menjalankan choco install dbeaver. Penginstal Windows juga tersedia dari halaman Unduh di situs web DBeaver.

Langkah 2: Mengonfigurasi Driver JDBC Azure Databricks untuk DBeaver

Siapkan DBeaver dengan informasi tentang Databricks JDBC Driver yang telah Anda unduh sebelumnya.

  1. Mulai DBeaver.
  2. Jika Anda diminta untuk membuat database baru, klik Tidak.
  3. Jika Anda diminta untuk menyambungkan atau memilih database, klik Batal.
  4. Klik Database > Driver Manager.
  5. Dalam kotak dialog Driver Manager, klik Baru.
  6. Dalam kotak dialog Buat driver baru, klik tab Pustaka.
  7. Klik Tambahkan File.
  8. Navigasikan ke folder tempat Anda mengekstrak Driver JDBC Azure Databricks.
  9. Navigasi satu tingkat lebih rendah untuk menemukan .jar file.
  10. .jar Sorot file dan klik Buka.
  11. Pada tab Pengaturan, untuk Nama Driver, masukkan Databricks.
  12. Pada tab Pengaturan, untuk Nama Kelas, masukkan com.databricks.client.jdbc.Driver.
  13. Klik OK.
  14. Dalam kotak dialog Driver Manager, klik Tutup.

Langkah 3: Hubungkan DBeaver ke database Azure Databricks Anda

Gunakan DBeaver untuk menyambungkan ke kluster atau gudang SQL, guna mengakses database pada ruang kerja Azure Databricks Anda.

  1. Pada DBeaver, klik Database > Koneksi Database Baru.

  2. Dalam kotak dialog Koneksi ke database, pada tab Semua, klik Databricks, lalu klik Berikutnya.

  3. Klik tab Utama dan masukkan nilai di bidang URL JDBC untuk sumber daya Azure Databricks Anda. Untuk sintaks bidang URL JDBC, lihat Pengaturan autentikasi untuk Driver JDBC Databricks.

  4. Klik Uji Koneksi.

    Tip

    Anda harus memulai sumber daya Azure Databricks Anda sebelum menguji koneksi. Jika tidak, pengujian mungkin memerlukan beberapa menit untuk diselesaikan saat sumber daya dimulai.

  5. Jika koneksi berhasil, dalam kotak dialog Uji Koneksi, klik OK.

  6. Dalam kotak dialog Koneksi ke database, klik Selesai.

Di jendela Database Navigator, entri Koneksi Baru akan ditampilkan. Untuk mengubah nama koneksi agar lebih mudah diidentifikasi:

  1. Klik kanan Databricks, kemudian klik Edit Koneksi.
  2. Di kotak dialog Pengaturan koneksi, klik Umum.
  3. Untuk Nama koneksi, ganti Databricks dengan nama lain untuk koneksi.
  4. Klik OK.

Ulangi instruksi dalam langkah ini untuk setiap sumber daya yang ingin Anda akses dengan DBeaver.

Langkah 4: Gunakan DBeaver untuk menelusuri database serta objeknya

Gunakan DBeaver untuk mengakses database serta objek database di ruang kerja Azure Databricks seperti tabel dan properti tabel, tampilan, indeks, jenis data, dan jenis objek lainnya.

  1. Pada DBeaver, di jendela Database Navigator, klik kanan pada koneksi yang ingin Anda gunakan.

  2. Jika Koneksi aktif, klik Koneksi. (Jika Koneksi dinonaktifkan, Anda sudah terhubung.)

    Tip

    Anda harus memulai sumber daya Anda sebelum mencoba terhubung ke sana. Jika tidak, koneksi mungkin memerlukan beberapa menit untuk diselesaikan saat sumber daya dimulai.

  3. Perluas koneksi yang baru saja Anda sambungkan.

  4. Perluas serta telusuri objek data yang tersedia. Klik dua kali objek data guna mendapatkan informasi selengkapnya tentang objek tersebut.

Ulangi instruksi pada langkah ini untuk mengakses tabel tambahan.

Langkah 5: Gunakan DBeaver untuk menjalankan pernyataan SQL

Gunakan DBeaver untuk memuat tabel sampel trips dari samples skema nyctaxi katalog.

  1. Pada DBeaver, di jendela Database Navigator, klik kanan pada koneksi yang ingin Anda gunakan.

  2. Jika Koneksi aktif, klik Koneksi. (Jika Koneksi dinonaktifkan, Anda sudah terhubung.)

    Tip

    Anda harus memulai sumber daya Anda sebelum mencoba terhubung ke sana. Jika tidak, koneksi mungkin memerlukan beberapa menit untuk diselesaikan saat sumber daya dimulai.

  3. Klik SQL Editor > Skrip SQL Baru.

  4. Pada tab (nama-koneksi) Skrip-1 , masukkan pernyataan SQL ini:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Klik Editor > SQL Jalankan skrip SQL.

Langkah berikutnya

Sumber Daya Tambahan: