安裝 Databricks Connect for Python

注意

本文涵蓋適用於 Databricks Runtime 13.3 LTS 以上版本的 Databricks Connect。

本文說明如何安裝 Python 版 Databricks Connect。 請參閱 Databricks Connect

需求

安裝 Databricks Connect 之前,請確定您的工作區和本機環境符合需求。 請參閱 Databricks Connect 使用需求

啟用 Python 虛擬環境

Databricks 強烈建議你在 Databricks Connect 中使用的每個 Python 版本都啟用一個Python virtual environment。 Python 虛擬環境有助於確保你使用正確的 Python 版本和 Databricks Connect 一起使用。 如需這些工具以及如何啟用這些工具的詳細資訊,請參閱 venv詩歌

安裝 Databricks Connect 用戶端

本節說明如何使用 venvPoetry 安裝 Databricks Connect 用戶端

注意

如果你已經安裝了 Visual Studio Code 的 Databricks 擴充功能,可以使用該擴充功能安裝 Databricks Connect for Databricks Runtime 13.3 LTS 及以上版本。 請參閱使用 Databricks Connect 進行 Debug 程式碼,了解 Visual Studio Code 的 Databricks 擴充功能。

使用 venv 安裝 Databricks Connect 用戶端

  1. 啟用虛擬環境后,執行 uninstall 命令,以卸載已安裝 PySpark。 這是必要的,因為 databricks-connect 套件與 PySpark 衝突。 如需詳細資訊,請參閱 衝突的 PySpark 安裝。 若要檢查是否已安裝 PySpark,請執行 show 命令。

    # Is PySpark already installed?
    pip3 show pyspark
    
    # Uninstall PySpark
    pip3 uninstall pyspark
    
  2. 在虛擬環境仍啟用之後,請執行 install 命令來安裝 Databricks Connect 用戶端。 --upgrade使用 選項,將任何現有的用戶端安裝升級至指定的版本。

    pip3 install --upgrade "databricks-connect==17.3.*"  # Or X.Y.* to match your cluster version.
    

    注意

    Databricks 建議您附加 「dot-asterisk」 表示法來指定 databricks-connect==X.Y.* ,而不是 databricks-connect=X.Y,以確保已安裝最新的套件。 雖然這不是必要條件,但它有助於確定您可以使用該叢集的最新支援功能。

使用詩歌安裝 Databricks Connect 用戶端

  1. 啟用虛擬環境后,執行 remove 命令,以卸載已安裝 PySpark。 這是必要的,因為 databricks-connect 套件與 PySpark 衝突。 如需詳細資訊,請參閱 衝突的 PySpark 安裝。 若要檢查是否已安裝 PySpark,請執行 show 命令。

    # Is PySpark already installed?
    poetry show pyspark
    
    # Uninstall PySpark
    poetry remove pyspark
    
  2. 在虛擬環境仍啟用之後,請執行 add 命令來安裝 Databricks Connect 用戶端。

    poetry add databricks-connect@~17.3  # Or X.Y to match your cluster version.
    

    注意

    Databricks 建議您使用「波狀符號」表示法來指定 databricks-connect@~17.3 ,而不是 databricks-connect==17.3,以確保已安裝最新的套件。 雖然這不是必要條件,但它有助於確定您可以使用該叢集的最新支援功能。