Apa ekstensi Databricks untuk Visual Studio Code?
Ekstensi Databricks untuk Visual Studio Code memungkinkan Anda menyambungkan ke ruang kerja Azure Databricks jarak jauh dari lingkungan pengembangan terintegrasi (IDE) Visual Studio Code yang berjalan di komputer pengembangan lokal Anda. Anda kemudian dapat:
- Tentukan, sebarkan, dan jalankan Bundel Aset Databricks untuk menerapkan pola CI/CD dan praktik terbaik ke pekerjaan Azure Databricks, alur Tabel Langsung Delta, dan Tumpukan MLOps menggunakan UI Visual Studio Code. Lihat Apa itu Fitur ekstensi Bundel Aset Databricks? dan Bundel Aset Databricks.
- Jalankan file kode Python lokal dari Visual Studio Code di kluster Azure Databricks di ruang kerja jarak jauh Anda. Lihat Menjalankan file Python pada kluster
- Jalankan file kode Python lokal (
.py
) dan notebook Python, R, Scala, dan SQL (.py
, ,.ipynb
.r
,.scala
dan.sql
) dari Visual Studio Code sebagai pekerjaan Azure Databricks di ruang kerja jarak jauh Anda. Lihat Menjalankan file Python sebagai pekerjaan. - Siapkan dan konfigurasikan lingkungan debugging Anda dan Databricks Connect menggunakan daftar periksa sederhana yang mengaktifkan dialog pemilihan. Lihat Kode debug menggunakan Databricks Connect untuk ekstensi Databricks untuk Visual Studio Code.
- Debug buku catatan sel demi sel dalam Visual Studio Code dengan Databricks Connect. Lihat Menjalankan dan men-debug sel notebook dengan Databricks Connect menggunakan ekstensi Databricks untuk Visual Studio Code.
- Sinkronkan kode lokal yang Anda kembangkan di Visual Studio Code dengan kode di ruang kerja jarak jauh Anda. Lihat Menyinkronkan folder ruang kerja Anda dengan Databricks
Catatan
Ekstensi Databricks untuk Visual Studio Code mendukung menjalankan notebook R, Scala, dan SQL sebagai pekerjaan otomatis tetapi tidak memberikan dukungan yang lebih dalam untuk bahasa ini dalam Visual Studio Code.
Mulai sekarang
Untuk mulai menggunakan ekstensi Databricks untuk Visual Studio Code:
- Pasang ekstensi.
- Membuat proyek Databricks baru atau mengonversi proyek Visual Studio Code yang sudah ada.
- Konfigurasikan proyek Anda dengan mudah menggunakan antarmuka pengguna ekstensi Databricks.
- Jalankan beberapa kode Python sebagai bagian dari tutorial ekstensi.
- Debug kode Anda menggunakan integrasi Databricks Connect.
- Uji kode Anda menggunakan
pytest
. Lihat Menjalankan pengujian dengan pytest menggunakan ekstensi Databricks untuk Visual Studio Code.
Membuat proyek Databricks baru
Setelah ekstensi diinstal, Anda dapat membuat proyek Databricks baru menggunakan ekstensi Databricks untuk Visual Studio Code:
- Luncurkan Visual Studio Code.
- Klik ikon Databricks di bar samping Visual Studio Code untuk membuka ekstensi.
- Klik Buat proyek baru.
- Di Palet Perintah , pilih host dan metode autentikasi untuk proyek. Lihat Menyiapkan otorisasi untuk ekstensi Databricks untuk Visual Studio Code.
- Di Berikan jalur ke folder tempat Anda ingin meletakkan proyek baru Anda, masukkan jalur ke folder di komputer pengembangan lokal tempat Anda ingin membuat proyek, atau klik Buka dialog pemilihan folder dan pilih jalur ke folder proyek.
- Agar Templat menggunakan dalam tampilan inisialisasi proyek Databricks, gunakan panah atas dan bawah untuk memilih templat proyek, lalu tekan Enter. Untuk informasi tentang templat proyek bundel, lihat Templat proyek Bundel Aset Databricks.
- Ketik Nama unik untuk proyek ini untuk proyek atau biarkan nama
my_project
proyek default , lalu tekan Enter. - Pilih apakah akan menambahkan buku catatan stub (sampel), stub (sampel) alur Delta Live Tables, atau paket Python stub (sampel) ke proyek, atau kombinasi stub (sampel) ini.
- Tekan tombol apa pun untuk menutup tab editor Databricks Project Init .
- Untuk Pilih proyek yang ingin Anda buka, pilih proyek yang baru saja Anda buat.
Buka proyek Bundel Aset Databricks yang ada
Proyek Bundel Aset Databricks memiliki databricks.yml
file di folder akar proyek. Lihat Konfigurasi Bundel Aset Databricks. Jika Anda ingin menggunakan ekstensi dengan proyek Bundel Aset Databricks yang ada:
Luncurkan Visual Studio Code. Dari menu utama, klik Buka File>Folder dan navigasikan ke direktori yang berisi proyek bundel Anda.
Klik ikon Databricks di bar samping Visual Studio Code untuk membuka dan mulai menggunakan fitur ekstensi.
Jika ekstensi Databricks untuk Visual Studio Code menemukan lebih dari satu proyek Bundel Aset Databricks di folder saat ini, ini memungkinkan Anda memilih untuk membuka proyek atau membuat file konfigurasi proyek di folder akar.
- Jika Anda memilih proyek, di Palet Perintah, pilih proyek Bundel Aset Databricks yang sudah ada.
- Jika Anda membuat konfigurasi di folder akar, folder tersebut menjadi proyek bundel.
Pilih metode host dan autentikasi untuk proyek. Lihat Mengatur otorisasi untuk ekstensi Databricks di Visual Studio Code.
Catatan
Jika Anda membuka proyek yang dibuat menggunakan ekstensi Databricks untuk Visual Studio Code v1, migrasi dicoba secara otomatis menggunakan konfigurasi autentikasi dan ruang kerja proyek yang ada. Tombol migrasi hanya tersedia jika migrasi otomatis gagal.
Beralih antar proyek Databricks
Ekstensi Databricks untuk Visual Studio Code memungkinkan Anda memiliki beberapa proyek Databricks dalam ruang kerja Visual Studio Code Anda dan dengan mudah beralih di antara mereka. Dengan proyek multi-bundel Anda terbuka di ruang kerja Visual Studio Code:
Klik ikon Databricks di bar samping Visual Studio Code untuk membuka ekstensi.
Klik Folder Lokal untuk memilih proyek yang akan digunakan ekstensi.
Catatan
Tindakan menjalankan hanya tersedia untuk file dalam bundel aktif.
Mengonversi proyek ke proyek Databricks
Jika Anda memiliki proyek yang sudah ada yang ingin Anda konversi ke proyek Databricks:
- Luncurkan Visual Studio Code. Dari menu utama, klik Buka File>Folder dan navigasikan ke proyek Anda untuk membukanya.
- Klik ikon Databricks di bar samping Visual Studio Code untuk membuka ekstensi.
- Klik Buat konfigurasi.
- Di Palet Perintah , pilih host dan metode autentikasi untuk proyek. Lihat Atur otorisasi pada ekstensi Databricks di Visual Studio Code.