Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Catatan
Artikel ini membahas Databricks Connect untuk Databricks Runtime 13.3 LTS ke atas.
Artikel ini menjelaskan cara menginstal Databricks Connect untuk Python. Lihat Apa itu Databricks Connect?.
Persyaratan
Sebelum menginstal Databricks Connect, pastikan ruang kerja dan lingkungan lokal Anda memenuhi persyaratan. Lihat Persyaratan penggunaan Databricks Connect.
Mengaktifkan lingkungan virtual Python
Databricks sangat menyarankan agar Anda mengaktifkan lingkungan virtual Python untuk setiap versi Python yang Anda gunakan dengan Databricks Connect. Lingkungan virtual Python membantu memastikan bahwa Anda menggunakan versi Python dan Databricks Connect yang benar bersama-sama. Untuk informasi selengkapnya tentang alat-alat ini dan cara mengaktifkannya, lihat venv atau Puisi.
Menginstal klien Databricks Connect
Bagian ini menjelaskan cara menginstal klien Databricks Connect dengan venv atau Poetry.
Catatan
Jika Anda sudah menginstal ekstensi Databricks untuk Visual Studio Code, Anda dapat menginstal Databricks Connect untuk Databricks Runtime 13.3 LTS ke atas menggunakan ekstensi. Lihat Kode debug menggunakan Databricks Connect untuk ekstensi Databricks untuk Visual Studio Code.
Menginstal klien Databricks Connect dengan venv
Dengan mengaktifkan lingkungan virtual Anda, hapus instalan PySpark, jika sudah diinstal, dengan menjalankan
uninstallperintah . Ini diperlukan karena paket bertentangandatabricks-connectdengan PySpark. Untuk detailnya, lihat Penginstalan PySpark yang Saling Bertentangan. Untuk memeriksa apakah PySpark sudah diinstal, jalankanshowperintah .# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pysparkDengan lingkungan virtual Anda masih diaktifkan, instal klien Databricks Connect dengan menjalankan
installperintah .--upgradeGunakan opsi untuk meningkatkan penginstalan klien yang ada ke versi yang ditentukan.pip3 install --upgrade "databricks-connect==17.3.*" # Or X.Y.* to match your cluster version.Catatan
Databricks merekomendasikan agar Anda menambahkan notasi "tanda bintang titik" untuk menentukan
databricks-connect==X.Y.*alih-alihdatabricks-connect=X.Y, untuk memastikan bahwa paket terbaru diinstal. Meskipun ini bukan persyaratan, ini membantu memastikan bahwa Anda dapat menggunakan fitur terbaru yang didukung untuk kluster tersebut.
Menginstal klien Databricks Connect dengan Puisi
Dengan mengaktifkan lingkungan virtual Anda, hapus instalan PySpark, jika sudah diinstal, dengan menjalankan
removeperintah . Ini diperlukan karena paket bertentangandatabricks-connectdengan PySpark. Untuk detailnya, lihat Penginstalan PySpark yang Saling Bertentangan. Untuk memeriksa apakah PySpark sudah diinstal, jalankanshowperintah .# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pysparkDengan lingkungan virtual Anda masih diaktifkan, instal klien Databricks Connect dengan menjalankan
addperintah .poetry add databricks-connect@~17.3 # Or X.Y to match your cluster version.Catatan
Databricks merekomendasikan agar Anda menggunakan notasi "at-tilde" untuk menentukan
databricks-connect@~17.3alih-alihdatabricks-connect==17.3, untuk memastikan bahwa paket terbaru diinstal. Meskipun ini bukan persyaratan, ini membantu memastikan bahwa Anda dapat menggunakan fitur terbaru yang didukung untuk kluster tersebut.