Alat pengembang
Databricks menyediakan ekosistem alat untuk membantu Anda mengembangkan aplikasi dan solusi yang terintegrasi dengan Azure Databricks dan mengelola sumber daya dan data Databricks secara terprogram.
Artikel ini memberikan gambaran umum tentang alat dan rekomendasi ini untuk alat terbaik untuk skenario pengembang umum.
Alat apa yang disediakan Databricks untuk pengembang?
Tabel berikut ini menyediakan daftar alat pengembang yang disediakan oleh Databricks.
Alat | Deskripsi |
---|---|
Autentikasi dan Otorisasi | Konfigurasikan autentikasi dan otorisasi untuk alat, skrip, dan aplikasi Anda agar berfungsi dengan Azure Databricks. |
Databricks Connect | Sambungkan ke Azure Databricks menggunakan lingkungan pengembangan terintegrasi (IDEs) populer seperti PyCharm, IntelliJ IDEA, Eclipse, RStudio, dan JupyterLab. Jika Anda menggunakan Visual Studio Code, Databricks merekomendasikan ekstensi Databricks untuk Visual Studio Code, yang dibangun di atas Databricks Connect, karena menyediakan fitur tambahan untuk mengaktifkan konfigurasi yang lebih mudah. |
Ekstensi Databricks untuk Visual Studio Code | Sambungkan ke ruang kerja Azure Databricks jarak jauh Anda dari lingkungan pengembangan terintegrasi (IDE) Visual Studio Code . |
Plugin PyCharm Databricks | Konfigurasikan koneksi ke ruang kerja Databricks jarak jauh dan jalankan file pada kluster Databricks dari PyCharm. Plugin ini dikembangkan dan disediakan oleh JetBrains dalam kemitraan dengan Databricks. |
SDK Databricks | Mengotomatiskan Azure Databricks dari pustaka kode yang ditulis untuk bahasa populer seperti Python, Java, Go, dan R. Alih-alih mengirim panggilan REST API secara langsung menggunakan curl/ Postman, Anda dapat menggunakan SDK untuk berinteraksi dengan Databricks menggunakan bahasa pemrograman pilihan Anda. |
Driver dan alat SQL | Sambungkan ke Azure Databricks untuk menjalankan perintah dan skrip SQL, berinteraksi secara terprogram dengan Azure Databricks, dan mengintegrasikan fungsionalitas Azure Databricks SQL ke dalam aplikasi yang ditulis dalam bahasa populer seperti Python, Go, JavaScript, dan TypeScript. |
Databricks CLI | Akses fungsionalitas Azure Databricks menggunakan antarmuka baris perintah (CLI) Databricks. CLI membungkus Databricks REST API, jadi alih-alih mengirim panggilan REST API secara langsung menggunakan curl atau Postman, Anda dapat menggunakan Databricks CLI untuk berinteraksi dengan Databricks. |
Bundel Aset Databricks | Terapkan praktik terbaik pengembangan, pengujian, dan penyebaran standar industri (CI/CD) untuk data Azure Databricks dan proyek AI Anda menggunakan Bundel Aset Databricks (DAB). |
Penyedia Databricks Terraform dan Terraform CDKTF untuk Databricks | Memprovisikan infrastruktur dan sumber daya Azure Databricks menggunakan Terraform. |
Penyedia sumber daya Pulumi Databricks | Memprovisikan infrastruktur dan sumber daya Azure Databricks menggunakan infrastruktur sebagai kode (IaC) Pulumi. |
Alat CI/CD | Integrasikan sistem dan kerangka kerja CI/CD populer seperti GitHub Actions, Jenkins, dan Apache Airflow. |
Tip
Anda juga dapat menghubungkan banyak alat pihak ketiga populer tambahan ke kluster dan gudang SQL untuk mengakses data di Azure Databricks. Lihat Mitra teknologi.
Alat pengembang mana yang harus saya gunakan?
Tabel berikut menguraikan rekomendasi alat Databricks untuk skenario pengembang umum.
Skenario | Rekomendasi |
---|---|
- Pengembangan interaktif dan penelusuran kesalahan dari IDE lokal | Ekstensi Databricks untuk Visual Studio Code Plugin PyCharm Databricks Untuk ID Lain, gunakan Databricks CLI dengan Databricks Connect |
- Interaksi langsung dengan Databricks dari baris perintah - Pembuatan skrip shell -Eksperimen - Memanggil REST API secara langsung - Mengelola profil autentikasi lokal - Sinkronkan kode dari IDE ke ruang kerja Databricks |
Databricks CLI |
- Mengelola alur kerja dan menyebarkan proyek ke Databricks - Menerapkan praktik terbaik CI/CD - Versi bersama, penulis bersama, menyebarkan bersama sumber daya dan aset Anda sebagai satu unit - Mendukung sumber daya yang paling umum |
Bundel Aset Databricks (fitur CLI) |
- Infrastruktur sebagai kode, CI/CD - Mengelola dan membuat ruang kerja, katalog, metastores, dan menerapkan izin - Menjamin portabilitas lingkungan dan pemulihan bencana - Banyak sumber daya yang didukung |
Penyedia Databricks Terraform |
- Pengembangan aplikasi - Integrasikan dengan sistem penyebaran yang ada - Membuat alur kerja Databricks kustom dan layanan web baru |
Databricks Python SDK Databricks Java SDK Databricks Go SDK Databricks R SDK |
- Skenario tingkat lanjut saja - Hampir semua sumber daya Databricks tersedia |
Databricks REST API |