Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Ekstensi Databricks untuk Visual Studio Code menawarkan tampilan Konfigurasi dalam panel ekstensi yang memungkinkan Anda untuk dengan mudah mengonfigurasi dan memperbarui pengaturan untuk proyek Databricks Anda. Fitur-fitur ini termasuk pemilih penyebaran ruang kerja yang ditargetkan, konfigurasi autentikasi dan komputasi yang mudah, sinkronisasi folder ruang kerja, dan langkah-langkah sederhana untuk mengaktifkan lingkungan virtual Python yang diperlukan untuk debugging.
Tampilan Konfigurasi dalam ekstensi Databricks untuk Visual Studio Code tersedia setelah Anda membuat atau memigrasikan proyek ke proyek Databricks. Lihat Membuat proyek Databricks baru.
Catatan
Versi sebelumnya dari ekstensi Databricks untuk Visual Studio Code mendefinisikan pengaturan konfigurasi dalam file JSON proyek dan variabel lingkungan diatur di terminal. Dalam versi rilis, konfigurasi proyek dan lingkungan ditemukan dalam databricks.yml file dan databricks.env .
Jika proyek Anda adalah Bundel Aset Databricks, UI ekstensi Databricks juga menyediakan Bundle Resource Explorer dan Bundle Variables View untuk mengelola sumber daya dan variabel bundel Anda. Lihat Fitur ekstensi Bundel Otomatisasi Deklaratif.
Mengubah sasaran ruang kerja penyebaran
Untuk memilih atau mengalihkan target penyebaran untuk proyek Databricks Anda (misalnya, untuk beralih dari dev target ke prod target):
Dalam tampilan Konfigurasi panel ekstensi Databricks, klik ikon roda gigi pada Pilih target Bundel Aset Databricks yang terhubung dengan Target.
Di Command Palette, pilih target penyebaran yang diinginkan.
Setelah target dikonfigurasi, Host dan Mode penyebaran ditampilkan. Untuk informasi tentang mode penyebaran Bundel Otomatisasi Deklaratif, lihat Mode penyebaran Bundel Otomatisasi Deklaratif.
Host lingkungan kerja dapat diubah dengan memodifikasi pengaturan target workspace dalam file konfigurasi yang terkait databricks.yml dengan proyek. Lihat sasaran.
Catatan
Ekstensi Databricks berikut untuk fitur Visual Studio Code hanya tersedia saat mode penyebaran target sedang dikembangkan:
- Gunakan kluster pengembangan terlampir untuk paket pekerjaan
- Menyinkronkan file dalam folder ruang kerja
- Pilih kluster pengembangan interaktif
Mengonfigurasi profil Databricks untuk proyek
Saat Anda membuat proyek Databricks atau mengonversi proyek menjadi proyek Databricks, Anda mengonfigurasi profil yang menyertakan pengaturan autentikasi yang digunakan untuk menyambungkan ke Databricks. Jika Anda ingin mengubah profil autentikasi yang digunakan, klik ikon gigi yang terkait dengan AuthType dalam tampilan Konfigurasi .
Untuk informasi selengkapnya ekstensi Databricks untuk autentikasi Visual Studio Code, lihat Menyiapkan otorisasi untuk ekstensi Databricks untuk Visual Studio Code.
Pilih komputasi untuk menjalankan kode dan pekerjaan
Dengan menggunakan ekstensi Databricks untuk Visual Studio Code, Anda dapat memilih tanpa server, memilih kluster Azure Databricks yang ada, atau membuat kluster Azure Databricks baru, untuk menjalankan kode dan pekerjaan Anda. Setelah Anda terhubung ke komputasi, ID kluster, versi Databricks Runtime, pembuat, status, dan mode akses ditampilkan. Anda juga dapat memulai dan menghentikan kluster, dan menavigasi langsung ke detail halaman kluster.
Petunjuk / Saran
Jika Anda tidak ingin menunggu kluster pekerjaan dimulai, periksa Mengesampingkan kluster Pekerjaan di bundel tepat di bawah pilihan kluster untuk menggunakan kluster yang dipilih untuk menjalankan pekerjaan bundel dalam mode pengembangan. Ini tidak tersedia jika Anda menggunakan komputasi tanpa server.
Menggunakan tanpa server
Komputasi tanpa server dikelola oleh Azure Databricks. Saat Anda menjalankan beban kerja pada komputasi tanpa server, Azure Databricks secara otomatis mengalokasikan dan mengelola sumber daya komputasi yang diperlukan.
Dalam tampilan Konfigurasi, di samping Kluster, klik Pilih kluster atau ikon gigi (Konfigurasikan kluster).
Di Palet Perintah, pilih Tanpa Server.
Menggunakan kluster yang ada
Jika Anda memiliki kluster Azure Databricks yang sudah ada yang ingin Anda gunakan:
Dalam tampilan Konfigurasi, di samping Kluster, klik Pilih kluster atau ikon gigi (Konfigurasikan kluster).
Palet Perintah, pilih klaster yang ingin Anda gunakan.
Membuat kluster baru
Jika Anda tidak memiliki kluster Azure Databricks yang sudah ada, atau Anda ingin membuat kluster baru:
Dalam tampilan Konfigurasi, di samping Kluster, klik ikon gigi (Konfigurasikan kluster).
Dalam Palet Perintah, klik Buat Kluster Baru.
Saat diminta untuk membuka situs web eksternal (ruang kerja Azure Databricks Anda), klik Buka.
Jika diminta, masuk ke ruang kerja Azure Databricks Anda.
Ikuti instruksi untuk membuat kluster.
Catatan
Databricks merekomendasikan agar Anda membuat kluster Komputasi Pribadi. Ini memungkinkan Anda untuk segera mulai menjalankan beban kerja, meminimalkan overhead manajemen komputasi.
Setelah kluster dibuat dan berjalan, kembali ke Visual Studio Code.
Dalam tampilan Konfigurasi, di samping Kluster, klik ikon gigi (Konfigurasikan kluster).
Di Palet Perintah, klik kluster yang ingin Anda gunakan.
Menyinkronkan folder ruang kerja Anda dengan Databricks
Anda dapat menyinkronkan folder ruang kerja Databricks jarak jauh yang terkait dengan proyek Databricks Anda dengan mengklik ikon sinkronisasi (Mulai sinkronisasi) yang terkait dengan Folder Jarak Jauh dalam tampilan Konfigurasi panel ekstensi Databricks.
Catatan
Ekstensi Databricks untuk Visual Studio Code hanya berfungsi dengan direktori ruang kerja yang dibuatnya. Anda tidak dapat menggunakan direktori ruang kerja yang ada di proyek Anda kecuali dibuat oleh ekstensi.
Untuk menavigasi ke tampilan ruang kerja di Databricks, klik ikon tautan eksternal (Buka tautan secara eksternal) yang terkait dengan Folder Jarak Jauh.
Ekstensi menentukan folder ruang kerja Azure Databricks yang akan digunakan sesuai dengan file_path pengaturan dalam workspace pemetaan konfigurasi bundel terkait proyek. Lihat ruang kerja.
Catatan
Ekstensi Databricks untuk Visual Studio Code hanya melakukan sinkronisasi satu arah otomatis perubahan file dari proyek Visual Studio Code lokal Anda ke folder ruang kerja terkait di ruang kerja Azure Databricks jarak jauh Anda. File dalam direktori ruang kerja jarak jauh ini dimaksudkan untuk sementara. Jangan memulai perubahan pada file-file ini dari dalam ruang kerja jarak jauh Anda, karena perubahan ini tidak akan disinkronkan kembali ke proyek lokal Anda.
Untuk detail penggunaan pada fitur sinkronisasi direktori ruang kerja untuk versi ekstensi Databricks sebelumnya untuk Visual Studio Code, lihat Memilih direktori ruang kerja untuk ekstensi Databricks untuk Visual Studio Code.
Menyiapkan lingkungan Python dan Databricks Connect Anda
Bagian Lingkungan Python dari tampilan Konfigurasi memungkinkan penyiapan yang mudah dari lingkungan pengembangan virtual Python Anda dan penginstalan Databricks Connect untuk menjalankan dan men-debug kode dan sel buku catatan. Lingkungan virtual Python memastikan bahwa proyek Anda menggunakan versi paket Python dan Python yang kompatibel (dalam hal ini, paket Databricks Connect).
Untuk mengonfigurasi lingkungan virtual Python untuk proyek Anda, dalam tampilan Konfigurasi panel ekstensi:
- Klik item Aktifkan Lingkungan Virtual berwarna merah di bawah Lingkungan Python.
- Pilih "Palet Perintah", pilih Venv atau Conda.
- Pilih dependensi yang ingin Anda instal, jika ada.
Untuk mengubah lingkungan, klik ikon gigi (Ubah lingkungan virtual) yang terkait dengan Lingkungan Aktif.
Untuk informasi tentang menginstal Databricks Connect, yang memungkinkan menjalankan dan men-debug kode dan notebook dalam Visual Studio Code, lihat Kode debug menggunakan Databricks Connect untuk ekstensi Databricks untuk Visual Studio Code.