Bagikan melalui


Menggunakan Visual Studio Code dengan Databricks Koneksi untuk Python

Catatan

Artikel ini membahas Databricks Koneksi untuk Databricks Runtime 13.0 ke atas.

Artikel ini membahas cara menggunakan Databricks Koneksi untuk Python dengan Visual Studio Code. Databricks Koneksi memungkinkan Anda menyambungkan ID populer, server notebook, dan aplikasi kustom lainnya ke kluster Azure Databricks. Lihat Apa itu Databricks Koneksi?. Untuk versi Scala artikel ini, lihat Menggunakan Visual Studio Code dengan Databricks Koneksi untuk Scala.

Catatan

Sebelum mulai menggunakan Databricks Koneksi, Anda harus menyiapkan klien Databricks Koneksi.

Tip

Ekstensi Databricks untuk Visual Studio Code sudah memiliki dukungan bawaan untuk Databricks Koneksi untuk Databricks Runtime 13.0 ke atas. Lihat Kode debug dengan menggunakan Databricks Koneksi untuk ekstensi Databricks untuk Visual Studio Code.

Untuk menggunakan Databricks Koneksi dengan Visual Studio Code dan Python, ikuti instruksi berikut.

  1. Memulai Visual Studio Code.

  2. Buka folder yang berisi lingkungan virtual Python Anda (Folder Buka File>).

  3. Di Terminal Visual Studio Code (Lihat > Terminal), aktifkan lingkungan virtual.

  4. Atur penerjemah Python saat ini menjadi penerjemah yang dirujuk dari lingkungan virtual:

    1. Pada Palet Perintah (Lihat Palet Perintah), ketik Python: Select Interpreter, lalu tekan Enter>.
    2. Pilih jalur ke penerjemah Python yang dirujuk dari lingkungan virtual.
  5. Tambahkan ke folder file kode Python (.py) yang berisi kode contoh atau kode Anda sendiri. Jika Anda menggunakan kode Anda sendiri, minimal Anda harus menginisialisasi DatabricksSession seperti yang ditunjukkan dalam kode contoh.

  6. Untuk menjalankan kode, klik Jalankan > Tanpa Penelusuran Kesalahan pada menu utama. Semua kode Python berjalan secara lokal, sementara semua kode PySpark yang melibatkan operasi DataFrame berjalan pada kluster di ruang kerja Azure Databricks jarak jauh dan respons eksekusi dikirim kembali ke pemanggil lokal.

  7. Untuk men-debug kode:

    1. Dengan file kode Python terbuka, atur titik henti apa pun di mana Anda ingin kode Anda dijeda saat berjalan.
    2. Klik ikon Jalankan dan Debug di bilah samping, atau klik Tampilkan > Jalankan pada menu utama.
    3. Di tampilan Jalankan dan Debug, klik tombol Jalankan dan Debug.
    4. Ikuti petunjuk di layar untuk mulai menjalankan dan menelusuri kesalahan kode.

    Semua kode Python di-debug secara lokal, sementara semua kode PySpark terus berjalan pada kluster di ruang kerja Azure Databricks jarak jauh. Kode mesin Spark inti tidak dapat di-debug langsung dari klien.

Untuk petunjuk eksekusi dan debug yang lebih spesifik, lihat Mengonfigurasi dan menjalankan debugger dan penelusuran kesalahan Python di Visual Studio Code.