Bagikan melalui


Integrasi DataGrip dengan Azure Databricks

Catatan

Artikel ini membahas DataGrip yang tidak disediakan atau didukung oleh Databricks. Untuk menghubungi penyedia, harap lihat Dukungan DataGrip.

DataGrip adalah lingkungan pengembangan terintegrasi (IDE) untuk pengembang database yang menyediakan konsol kueri, navigasi skema, rencana penjelasan, penyelesaian kode cerdas, analisis waktu nyata dan perbaikan cepat, pemfaktoran ulang, integrasi kontrol versi, dan lainnya fitur.

Artikel ini menjelaskan cara menggunakan mesin pengembangan lokal Anda untuk menginstal, mengonfigurasi, dan menggunakan DataGrip untuk bekerja dengan database di Azure Databricks.

Catatan

Artikel ini diuji dengan macOS, Driver Databricks JDBC versi 2.6.36, dan DataGrip versi 2023.3.1.

Persyaratan

Sebelum Anda menginstal DataGrip, mesin pengembangan lokal Anda harus memenuhi persyaratan berikut:

  • Sistem operasi Linux, macOS, atau Windows.
  • Unduh Driver Databricks JDBC ke mesin pengembangan lokal Anda, ekstrak file DatabricksJDBC42.jar dari file DatabricksJDBC42-<version>.zip yang diunduh.
  • Kluster Azure Databricks atau gudang SQL untuk terhubung dengan DataGrip.

Langkah 1: Instal DataGrip

Unduh dan instal DataGrip.

  • Linux: Unduh file .zip, ekstrak isinya, lalu ikuti petunjuk di file Install-Linux-tar.txt.
  • macOS: Unduh dan jalankan file .dmg.
  • Windows: Unduh dan jalankan file .exe.

Untuk informasi selengkapnya, lihat Menginstal DataGrip di situs web DataGrip.

Langkah 2: Konfigurasikan Driver Databricks JDBC untuk DataGrip

Siapkan DataGrip dengan informasi tentang Driver Databricks JDBC yang telah Anda unduh tadi.

  1. Mulai DataGrip.
  2. Klik File > Sumber Data.
  3. Di kotak dialog Sumber Data dan Driver, klik tab Driver.
  4. Klik tombol + (Driver) untuk menambahkan driver.
  5. Untuk Nama, masukkan Databricks.
  6. Di tab Umum, dalam daftar File Driver, klik tombol + (Tambah).
  7. Klik JAR Kustom.
  8. Jelajahi dan pilih file DatabricksJDBC42.jar yang Anda ekstrak sebelumnya, lalu klik Buka.
  9. Untuk Kelas, harap pilih com.databricks.client.jdbc.Driver.
  10. Klik OK.

Langkah 3: Hubungkan DataGrip ke database Azure Databricks Anda

  1. Di DataGrip, klik File > Sumber Data.

  2. Di tab Sumber Data, klik tombol + (Tambahkan).

  3. Pilih driver Databricks yang Anda tambahkan di langkah sebelumnya.

  4. Pada tab Umum , untuk URL, masukkan nilai bidang URL JDBC untuk sumber daya Azure Databricks Anda. Untuk sintaks bidang URL JDBC, lihat Pengaturan autentikasi untuk Driver JDBC Databricks.

    Catatan

    ConnCatalog Pengaturan kemampuan driver harus ditentukan pada URL JDBC, jika tidak, skema tidak dapat diidentifikasi.

  5. Klik Uji Koneksi.

    Tip

    Anda harus memulai sumber daya Anda sebelum menguji koneksi Anda. Jika tidak, pengujian mungkin memerlukan beberapa menit untuk diselesaikan saat sumber daya dimulai.

  6. Jika koneksi berhasil, pada tab Skema , centang kotak untuk skema yang ingin Anda akses, misalnya Semua skema.

  7. Klik OK.

Ulangi instruksi dalam langkah ini untuk setiap sumber daya yang ingin Anda akses DataGrip-nya.

Langkah 4: Gunakan DataGrip untuk menelusuri tabel

Gunakan DataGrip untuk mengakses tabel di ruang kerja Azure Databricks Anda.

  1. Di DataGrip, di jendela Database, perluas simpul sumber daya Anda, perluas skema yang ingin Anda jelajahi, lalu luaskan tabel.
  2. Klik dua kali tabel. Kumpulan baris pertama dari tabel ditampilkan.

Ulangi instruksi di langkah ini untuk mengakses tabel tambahan.

Untuk mengakses tabel dalam skema lain, di bilah alat jendela Database, klik ikon Properti Sumber Data. Di kotak dialog Sumber dan Driver Data, pada tab Skema, centang kotak untuk setiap skema tambahan yang ingin Anda akses, lalu klik OK.

Langkah 5: Gunakan DataGrip untuk menjalankan pernyataan SQL

Gunakan DataGrip untuk memuat tabel sampel trips dari samples skema nyctaxi katalog.

  1. Di DataGrip, klik File > File SQL Baru>.

  2. Masukkan nama untuk file, misalnya select_trips.

  3. Di tab select_trips.sql file, masukkan pernyataan SQL berikut:

    SELECT * FROM samples.nyctaxi.trips;
    
  4. Pilih pernyataan SELECT.

  5. Pada bilah alat tab file, klik ikon Jalankan.

Langkah berikutnya

Sumber Daya Tambahan: