Bagikan melalui


Gunakan JupyterLab dengan Databricks Connect untuk Python

Catatan

Artikel ini membahas Databricks Connect untuk Databricks Runtime 13.3 LTS ke atas.

Artikel ini membahas cara menggunakan Databricks Connect untuk Python dengan JupyterLab. Databricks Connect memungkinkan Anda menyambungkan server notebook, IDEs, dan aplikasi kustom populer lainnya ke kluster Azure Databricks. Lihat Apa itu Databricks Connect?.

Catatan

Sebelum mulai menggunakan Databricks Connect, Anda harus menyiapkan klien Databricks Connect.

Untuk menggunakan Databricks Connect dengan JupyterLab dan Python, ikuti instruksi berikut.

  1. Untuk menginstal JupyterLab, dengan lingkungan virtual Python Anda diaktifkan, jalankan perintah berikut dari terminal atau Prompt Perintah Anda:

    pip3 install jupyterlab
    
  2. Untuk memulai JupyterLab di browser web Anda, jalankan perintah berikut dari lingkungan virtual Python yang diaktifkan:

    jupyter lab
    

    Jika JupyterLab tidak muncul di browser web Anda, salin URL yang dimulai dengan localhost atau 127.0.0.1 dari lingkungan virtual Anda, dan masukkan di bilah alamat browser web Anda.

  3. Buat buku catatan baru: di JupyterLab, klik File > Buku Catatan Baru > di menu utama, pilih Python 3 (ipykernel) dan klik Pilih.

  4. Di sel pertama buku catatan, masukkan kode contoh atau kode Anda sendiri. Jika Anda menggunakan kode Anda sendiri, minimal Anda harus menginisialisasi DatabricksSession seperti yang ditunjukkan dalam kode contoh.

  5. Untuk menjalankan buku catatan, klik Jalankan Jalankan > Semua Sel. Semua kode berjalan secara lokal, sementara semua kode yang melibatkan operasi DataFrame berjalan pada kluster di ruang kerja Azure Databricks jarak jauh dan respons eksekusi dikirim kembali ke pemanggil lokal.

  6. Untuk men-debug buku catatan, klik ikon bug (Aktifkan Debugger) di samping Python 3 (ipykernel) di toolbar buku catatan. Atur satu atau beberapa titik henti, lalu klik Jalankan Jalankan > Semua Sel. Semua kode di-debug secara lokal, sementara semua kode Spark terus berjalan pada kluster di ruang kerja Azure Databricks jarak jauh. Kode mesin Spark inti tidak dapat di-debug langsung dari klien.

  7. Untuk mematikan JupyterLab, klik Matikan File>. Jika proses JupyterLab masih berjalan di terminal atau Prompt Perintah Anda, hentikan proses ini dengan menekan Ctrl + c lalu masukkan y untuk mengonfirmasi.

Untuk instruksi debug yang lebih spesifik, lihat Debugger.