Apa ekstensi Databricks untuk Visual Studio Code?
Ekstensi Databricks untuk Visual Studio Code memungkinkan Anda menyambungkan ke ruang kerja Azure Databricks jarak jauh dari lingkungan pengembangan terintegrasi (IDE) Visual Studio Code yang berjalan di komputer pengembangan lokal Anda. Anda kemudian dapat:
- Tentukan, sebarkan, dan jalankan Bundel Aset Databricks untuk menerapkan pola CI/CD dan praktik terbaik ke pekerjaan Azure Databricks, alur Tabel Langsung Delta, dan Tumpukan MLOps menggunakan UI Visual Studio Code. Lihat Apa itu Fitur ekstensi Bundel Aset Databricks? dan Bundel Aset Databricks.
- Jalankan file kode Python lokal dari Visual Studio Code di kluster Azure Databricks di ruang kerja jarak jauh Anda. Lihat Menjalankan file Python pada kluster
- Jalankan file kode Python lokal (
.py
) dan notebook Python, R, Scala, dan SQL (.py
, ,.r
.ipynb
,.scala
dan.sql
) dari Visual Studio Code sebagai pekerjaan Azure Databricks di ruang kerja jarak jauh Anda. Lihat Menjalankan file Python sebagai pekerjaan. - Siapkan dan konfigurasikan lingkungan penelusuran kesalahan Anda dan Databricks Connect menggunakan daftar periksa sederhana yang memicu dialog pemilihan. Lihat Kode debug menggunakan Databricks Connect untuk ekstensi Databricks untuk Visual Studio Code.
- Debug buku catatan sel demi sel dalam Visual Studio Code dengan Databricks Connect. Lihat Menjalankan dan men-debug sel notebook dengan Databricks Connect menggunakan ekstensi Databricks untuk Visual Studio Code.
- Sinkronkan kode lokal yang Anda kembangkan di Visual Studio Code dengan kode di ruang kerja jarak jauh Anda.
Catatan
Ekstensi Databricks untuk Visual Studio Code mendukung menjalankan notebook R, Scala, dan SQL sebagai pekerjaan otomatis tetapi tidak memberikan dukungan yang lebih dalam untuk bahasa ini dalam Visual Studio Code.
Memulai
Untuk mulai menggunakan ekstensi Databricks untuk Visual Studio Code:
- Pasang ekstensi.
- Buat proyek Databricks baru atau migrasikan proyek Visual Studio Code yang sudah ada.
- Konfigurasikan proyek Anda dengan mudah menggunakan antarmuka pengguna ekstensi Databricks.
- Jalankan beberapa kode Python sebagai bagian dari tutorial ekstensi.
- Debug kode Anda menggunakan integrasi Databricks Connect.
- Uji kode Anda menggunakan
pytest
. Lihat Menjalankan pengujian dengan pytest menggunakan ekstensi Databricks untuk Visual Studio Code.
Membuat proyek Databricks baru
Setelah ekstensi diinstal, Anda dapat membuat proyek Databricks baru menggunakan ekstensi Databricks untuk Visual Studio Code:
- Luncurkan Visual Studio Code.
- Klik ikon Databricks di bar samping Visual Studio Code untuk membuka ekstensi.
- Klik Buat Proyek Databricks baru.
- Di Palet Perintah, pilih host dan metode autentikasi untuk proyek. Lihat Penyiapan autentikasi untuk ekstensi Databricks untuk Visual Studio Code.
- Di Sediakan jalur ke folder tempat Anda menginginkan proyek baru, masukkan jalur ke folder di komputer pengembangan lokal tempat Anda ingin membuat proyek, atau klik dialog Buka pemilihan folder dan pilih jalur ke folder proyek.
- Agar Templat dapat digunakan dalam tampilan inisialisasi proyek Databricks, gunakan panah atas dan bawah untuk memilih templat proyek, lalu tekan Enter. Untuk informasi tentang templat proyek bundel, lihat Templat proyek Bundel Aset Databricks.
- Ketik Nama unik untuk proyek ini untuk proyek atau biarkan nama
my_project
proyek default , lalu tekan Enter. - Pilih apakah akan menambahkan buku catatan stub (sampel), stub (sampel) alur Delta Live Tables, atau paket Python stub (sampel) ke proyek, atau kombinasi stub (sampel) ini.
- Tekan tombol apa pun untuk menutup tab editor Databricks Project Init .
- Untuk Pilih proyek yang ingin Anda buka, pilih proyek yang baru saja Anda buat.
Memigrasikan proyek ke proyek Databricks
Jika Anda memiliki proyek yang sudah ada yang ingin Anda migrasikan ke proyek Databricks, buka dengan ekstensi Databricks untuk Visual Studio Code untuk memulai migrasi:
- Luncurkan Visual Studio Code. Dari menu utama, klik Buka File>Folder dan navigasikan ke proyek Anda untuk membukanya.
- Klik ikon Databricks di bar samping Visual Studio Code untuk membuka ekstensi.
- Klik Migrasi ke Proyek Databricks.
- Di Palet Perintah, pilih host dan metode autentikasi untuk proyek. Lihat Penyiapan autentikasi untuk ekstensi Databricks untuk Visual Studio Code.
Catatan
Jika Anda membuka proyek yang dibuat menggunakan ekstensi Databricks untuk Visual Studio Code v1, migrasi dicoba secara otomatis menggunakan konfigurasi autentikasi dan ruang kerja proyek yang ada. Tombol migrasi hanya tersedia jika migrasi otomatis gagal.
Buka proyek Bundel Aset Databricks yang ada
Jika ekstensi Databricks untuk Visual Studio Code menemukan lebih dari satu proyek Bundel Aset Databricks di folder saat ini, ekstensi Databricks untuk Visual Studio Code memungkinkan Anda memilih proyek mana yang akan dibuka.
Catatan
Proyek Bundel Aset Databricks memiliki databricks.yml
file di folder akar proyek. Lihat Konfigurasi Bundel Aset Databricks.
Luncurkan Visual Studio Code. Dari menu utama, klik Buka File>Folder dan navigasikan ke direktori yang berisi proyek bundel Anda.
Klik ikon Databricks di bar samping Visual Studio Code untuk membuka ekstensi.
Klik Buka Proyek Databricks yang sudah ada.
Di Palet Perintah, pilih proyek Bundel Aset Databricks yang ada.
Di Palet Perintah, pilih host dan metode autentikasi untuk proyek. Lihat Penyiapan autentikasi untuk ekstensi Databricks untuk Visual Studio Code.
Menambahkan proyek Databricks lain ke ruang kerja
Ekstensi Databricks untuk Visual Studio Code memungkinkan Anda memiliki beberapa proyek Databricks dalam ruang kerja Visual Studio Code Anda dan dengan mudah beralih di antara mereka. Untuk menambahkan proyek lain:
Luncurkan Visual Studio Code. Dari menu utama, klik Tambahkan File>Folder ke Ruang Kerja dan navigasikan ke direktori yang berisi proyek bundel Anda yang lain.
Klik ikon Databricks di bar samping Visual Studio Code untuk membuka ekstensi.
Klik Folder Ruang Kerja Aktif untuk memilih proyek yang akan digunakan ekstensi.