Kode debug menggunakan Databricks Connect untuk ekstensi Databricks untuk Visual Studio Code

Artikel ini menjelaskan cara menggunakan integrasi Databricks Connect dalam ekstensi Databricks agar Visual Studio Code dapat menjalankan dan men-debug file Python individu (.py). Untuk informasi tentang ekstensi, lihat ekstensi Databricks untuk Visual Studio Code.

Integrasi Databricks Connect juga memungkinkan Anda menjalankan dan men-debug sel notebook. Lihat Jalankan dan debug sel notebook dengan Databricks Connect menggunakan ekstensi Databricks untuk Visual Studio Code.

Persyaratan

Sebelum Anda dapat menggunakan Databricks Connect dari dalam ekstensi Databricks untuk Visual Studio Code, Anda harus terlebih dahulu memenuhi persyaratan Databricks Connect. Persyaratan ini mencakup hal-hal seperti ruang kerja yang mendukung Unity Catalog, persyaratan komputasi, dan persyaratan versi untuk penginstalan lokal Python Anda.

Mengaktifkan lingkungan virtual Python

Aktifkan lingkungan Python virtual untuk proyek Python Anda. Lingkungan virtual Python membantu memastikan bahwa proyek Anda menggunakan versi Python dan paket Python yang kompatibel (dalam hal ini, paket Databricks Connect).

Di panel Konfigurasi :

  1. Klik item merah Aktifkan Lingkungan Virtual di bawah Lingkungan Python.
  2. Di Palet Perintah, pilih Venv atau Conda.
  3. Pilih dependensi yang ingin Anda instal, jika ada.

Menginstal Databricks Connect

Dalam tampilan Configuration di bawah Python Environment:

  1. Klik tombol play merah Instal databricks-connect.
  2. Pasang kluster.
    • Jika bagian Kluster belum dikonfigurasi dalam ekstensi, pesan berikut muncul: "Harap lampirkan kluster untuk menggunakan Databricks Connect." Klik Lampirkan Kluster dan pilih kluster yang memenuhi persyaratan Databricks Connect.
    • Jika bagian Kluster dikonfigurasi tetapi kluster tidak kompatibel dengan Databricks Connect, klik tombol merah Databricks Connect dinonaktifkan , klik Lampirkan Kluster, dan pilih kluster yang kompatibel.
  3. Jika paket Databricks Connect (dan dependensinya) belum diinstal, pesan berikut muncul: "Untuk penelusuran kesalahan interaktif dan pelengkapan otomatis, Anda memerlukan Databricks Connect. Apakah Anda ingin menginstalnya di lingkungan <environment-name>." Klik Pasang.
  4. Di bilah status Visual Studio Code, jika tombol Databricks Connect dinonaktifkan muncul dengan warna merah, klik tombol tersebut dan ikuti instruksi di layar untuk mengaktifkannya.
  5. Setelah tombol Databricks Connect diaktifkan muncul, Anda sekarang siap untuk menggunakan Databricks Connect.

Catatan

Jika Anda menggunakan Poetry, Anda dapat menyinkronkan pyproject.toml dan poetry.lock file Anda dengan paket Databricks Connect yang diinstal (dan dependensinya) dengan menjalankan perintah berikut. Pastikan untuk mengganti 16.4.1 dengan versi paket Databricks Connect yang cocok dengan yang diinstal oleh ekstensi Databricks untuk Visual Studio Code untuk proyek Anda.

poetry add databricks-connect==16.4.1

Mulai atau debug kode Python Anda

Setelah Anda mengaktifkan Databricks Connect, jalankan atau debug file Python Anda (.py):

  1. Di proyek Anda, buka file Python yang ingin Anda jalankan atau debug.

  2. Setel titik henti debugging apa pun dalam file Python.

  3. Klik ikon Jalankan di Databricks yang berada di sebelah daftar tab editor, lalu klik Debug berkas saat ini dengan Databricks Connect.

    Debug file saat ini dari ikon

    Output muncul pada pane Konsol Debug.

    Anda juga dapat mengklik kanan file .py, lalu mengklik Jalankan pada file Databricks>Debug saat ini dengan Databricks Connect.

    Men-debug file saat ini dari menu konteks