Menggunakan Eclipse dengan PyDev dan Databricks Connect untuk Python

Artikel
07/16/2024

Catatan

Artikel ini membahas Databricks Connect untuk Databricks Runtime 13.3 LTS ke atas.

Artikel ini membahas cara menggunakan Databricks Connect untuk Scala dan Eclipse dengan PyDev. Databricks Connect memungkinkan Anda menyambungkan ID Populer, server notebook, dan aplikasi kustom lainnya ke kluster Azure Databricks. Lihat Apa itu Databricks Connect?.

Catatan

Sebelum mulai menggunakan Databricks Connect, Anda harus menyiapkan klien Databricks Connect.

Untuk menggunakan Databricks Connect dan Eclipse dengan PyDev, ikuti instruksi berikut.

Mulai Eclipse.
Buat proyek: klik File > Proyek Baru > Proyek > PyDev > PyDev Project, lalu klik Berikutnya.
Tentukan Nama proyek.
Untuk konten Project, tentukan jalur ke lingkungan virtual Python Anda.
Klik Silakan konfigurasikan penerjemah sebelum melakukan proceding.
Klik Konfigurasi manual.
Klik Telusuri Baru > untuk python/pypy exe.
Telusuri dan pilih jalur lengkap ke penerjemah Python yang dirujuk dari lingkungan virtual, lalu klik Buka.
Dalam dialog Pilih penerjemah, klik OK.
Dalam dialog Pilihan yang diperlukan, klik OK.
Dalam dialog Preferensi, klik Terapkan dan Tutup.
Dalam dialog Proyek PyDev, klik Selesai.
Klik Buka Perspektif.
Tambahkan ke proyek file kode Python (.py) yang berisi kode contoh atau kode Anda sendiri. Jika Anda menggunakan kode Anda sendiri, minimal Anda harus menginisialisasi DatabricksSession seperti yang ditunjukkan dalam kode contoh.
Dengan file kode Python terbuka, atur titik henti apa pun di mana Anda ingin kode Anda dijeda saat berjalan.
Untuk menjalankan kode, klik Jalankan Jalankan>. Semua kode Python berjalan secara lokal, sementara semua kode PySpark yang melibatkan operasi DataFrame berjalan pada kluster di ruang kerja Azure Databricks jarak jauh dan respons eksekusi dikirim kembali ke pemanggil lokal.
Untuk men-debug kode, klik Jalankan > Debug. Semua kode Python di-debug secara lokal, sementara semua kode PySpark terus berjalan pada kluster di ruang kerja Azure Databricks jarak jauh. Kode mesin Spark inti tidak dapat di-debug langsung dari klien.

Untuk instruksi eksekusi dan debug yang lebih spesifik, lihat Menjalankan Program.

Bagikan melalui

Menggunakan Eclipse dengan PyDev dan Databricks Connect untuk Python

Saran dan Komentar

Sumber Daya Tambahan: