Pengaturan kemampuan driver untuk Driver JDBC Databricks (Simba)

Nota

Halaman ini berlaku untuk Simba JDBC Driver (Legacy), versi di bawah versi 3. Databricks sangat merekomendasikan migrasi ke Driver JDBC Databricks untuk konektivitas JDBC. Ini termasuk peningkatan seperti dukungan untuk tampilan metrik Katalog Unity, transaksi yang mencakup beberapa pernyataan SQL, prosedur tersimpan, pengambilan hasil besar yang lebih cepat, dan telemetri klien bawaan.

Halaman ini menjelaskan cara mengonfigurasi pengaturan kemampuan driver khusus dan tingkat lanjut untuk Driver Databricks JDBC.

Driver Databricks JDBC menyediakan pengaturan kemampuan driver khusus dan tingkat lanjut berikut.

Dukungan kueri ANSI SQL-92 di ODBC

Driver Warisan Spark JDBC menerima kueri SQL dalam dialek ANSI SQL-92 dan menerjemahkannya ke Databricks SQL sebelum mengirimkannya ke server.

Jika aplikasi Anda menghasilkan Databricks SQL secara langsung atau menggunakan sintaks non-ANSI SQL-92 khusus untuk Azure Databricks, atur UseNativeQuery=1 dalam konfigurasi koneksi Anda. Pengaturan ini meneruskan kueri SQL verbatim ke Azure Databricks tanpa terjemahan.

Katalog dan skema default

Untuk menentukan katalog dan skema default, tambahkan ConnCatalog=<catalog-name>;ConnSchema=<schema-name> ke URL koneksi JDBC.

Tag query untuk pelacakan

Penting

Fitur ini ada di Pratinjau Privat. Untuk meminta akses, hubungi tim akun Anda.

Lampirkan tag kunci-nilai ke kueri SQL Anda untuk tujuan pelacakan dan analitik. Tag kueri muncul dalam system.query.history tabel untuk identifikasi dan analisis kueri.

Untuk menambahkan tag kueri ke koneksi Anda, sertakan ssp_query_tags parameter di URL koneksi JDBC Anda:

jdbc:databricks://<server-hostname>:443;httpPath=<http-path>;ssp_query_tags=key1:value1,key2:value2

Tentukan tag kueri sebagai pasangan nilai kunci yang dipisahkan koma, di mana setiap kunci dan nilai dipisahkan oleh titik dua. Contohnya, key1:value1,key2:value2.

Mengekstrak hasil kueri besar di JDBC

Untuk mencapai performa terbaik saat Anda mengekstrak hasil kueri yang besar, gunakan versi terbaru driver ODBC yang menyertakan pengoptimalan berikut.

Serialisasi Arrow di JDBC

Driver JDBC versi 2.6.16 ke atas mendukung format serialisasi hasil kueri yang dioptimalkan yang menggunakan Apache Arrow.

Pengambilan Cloud di JDBC

Driver JDBC versi 2.6.19 ke atas mendukung Cloud Fetch, kemampuan yang mengambil hasil kueri melalui penyimpanan cloud yang dikonfigurasi dalam penyebaran Azure Databricks Anda.

Saat Anda menjalankan kueri, Azure Databricks menyimpan hasilnya di penyimpanan cloud ruang kerja Anda sebagai file berseri Panah hingga 20 MB. Setelah kueri selesai, driver mengirim permintaan pengambilan, dan Azure Databricks mengembalikan URL shared access signature (SAS) ke file hasil. Driver kemudian menggunakan URL ini untuk mengunduh hasil langsung dari penyimpanan Azure.

Cloud Fetch hanya berlaku untuk hasil kueri yang lebih besar dari 1 MB. Driver mengambil hasil yang lebih kecil langsung dari Azure Databricks.

Azure Databricks secara otomatis mengumpulkan akumulasi file dengan menandainya untuk dihapus setelah 24 jam dan menghapusnya secara permanen 24 jam kemudian.

Prasyarat jaringan

Jika jaringan Anda bersifat privat, Anda harus mengonfigurasi pengaturan berikut agar Cloud Fetch berfungsi:

  • Izinkan *.blob.core.windows.net dan *.store.core.windows.net di lingkungan jaringan Anda.
  • Tambahkan unduhan dan pencabutan sertifikat yang diperlukan ke daftar izinkan Anda.
  • Jika dukungan firewall diaktifkan di akun penyimpanan ruang kerja Azure Databricks Anda, konfigurasikan gateway data jaringan virtual atau gateway data lokal untuk mengizinkan akses privat ke akun penyimpanan.

Untuk menonaktifkan Cloud Fetch, atur EnableQueryResultDownload=0 dalam konfigurasi koneksi Anda.

Mendiagnosis pengunduhan lambat

Atur LogLevel ke 4 (INFO) dan LogPath ke jalur lengkap folder log untuk melihat metrik kecepatan unduhan Cloud Fetch. Kecepatan pengunduhan log driver per gugus, sehingga kumpulan hasil besar menghasilkan beberapa baris log. Driver juga mencatat peringatan ketika kecepatan berada di bawah sekitar 1 MB/dtk. Fitur ini tersedia dalam versi driver JDBC (Simba) yang dirilis setelah Desember 2025.

Jika unduhan lambat atau terhenti, token SAS dapat kedaluwarsa sebelum driver selesai mengunduh semua file hasil. Periksa pembatasan bandwidth atau kemacetan jaringan antara klien dan Azure Blob Storage.

Aktifkan pencatatan log

Untuk mengaktifkan pengelogan di driver JDBC, atur LogLevel properti ke nilai antara 1 (peristiwa parah saja) dan 6 (semua aktivitas driver). Atur LogPath properti ke jalur lengkap folder tempat Anda ingin menyimpan file log.

Untuk informasi selengkapnya, lihat Mengonfigurasi Pengelogan di Panduan Driver Databricks JDBC.