注意
本文涵蓋適用於 Databricks Runtime 13.3 LTS 以上版本的 Databricks Connect。
本文說明如何安裝 Python 版 Databricks Connect。 請參閱 Databricks Connect。
需求
安裝 Databricks Connect 之前,請確定您的工作區和本機環境符合需求。 請參閱 Databricks Connect 使用需求。
啟用 Python 虛擬環境
Databricks 強烈建議你在 Databricks Connect 中使用的每個 Python 版本都啟用一個Python virtual environment。 Python 虛擬環境有助於確保你使用正確的 Python 版本和 Databricks Connect 一起使用。 如需這些工具以及如何啟用這些工具的詳細資訊,請參閱 venv 或 詩歌。
安裝 Databricks Connect 用戶端
本節說明如何使用 venv 或 Poetry 安裝 Databricks Connect 用戶端。
注意
如果你已經安裝了 Visual Studio Code 的 Databricks 擴充功能,可以使用該擴充功能安裝 Databricks Connect for Databricks Runtime 13.3 LTS 及以上版本。 請參閱使用 Databricks Connect 進行 Debug 程式碼,了解 Visual Studio Code 的 Databricks 擴充功能。
使用 venv 安裝 Databricks Connect 用戶端
啟用虛擬環境后,執行
uninstall命令,以卸載已安裝 PySpark。 這是必要的,因為databricks-connect套件與 PySpark 衝突。 如需詳細資訊,請參閱 衝突的 PySpark 安裝。 若要檢查是否已安裝 PySpark,請執行show命令。# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pyspark在虛擬環境仍啟用之後,請執行
install命令來安裝 Databricks Connect 用戶端。--upgrade使用 選項,將任何現有的用戶端安裝升級至指定的版本。pip3 install --upgrade "databricks-connect==17.3.*" # Or X.Y.* to match your cluster version.注意
Databricks 建議您附加 「dot-asterisk」 表示法來指定
databricks-connect==X.Y.*,而不是databricks-connect=X.Y,以確保已安裝最新的套件。 雖然這不是必要條件,但它有助於確定您可以使用該叢集的最新支援功能。
使用詩歌安裝 Databricks Connect 用戶端
啟用虛擬環境后,執行
remove命令,以卸載已安裝 PySpark。 這是必要的,因為databricks-connect套件與 PySpark 衝突。 如需詳細資訊,請參閱 衝突的 PySpark 安裝。 若要檢查是否已安裝 PySpark,請執行show命令。# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pyspark在虛擬環境仍啟用之後,請執行
add命令來安裝 Databricks Connect 用戶端。poetry add databricks-connect@~17.3 # Or X.Y to match your cluster version.注意
Databricks 建議您使用「波狀符號」表示法來指定
databricks-connect@~17.3,而不是databricks-connect==17.3,以確保已安裝最新的套件。 雖然這不是必要條件,但它有助於確定您可以使用該叢集的最新支援功能。