Pythonhoz a Databricks Connect telepítése

Megjegyzés

Ez a cikk a Databricks Runtime 13.3 LTS-hez készült Databricks Connectet ismerteti.

Ez a cikk azt ismerteti, hogyan telepíthető a Databricks Connect Python. Lásd : Databricks Connect.

Követelmények

A Databricks Connect telepítése előtt győződjön meg arról, hogy a munkaterület és a helyi környezet megfelel a követelményeknek. Lásd a Databricks Connect használati követelményeit.

Python virtuális környezet aktiválása

A Databricks határozottan javasolja, hogy Python virtual környezet legyen aktiválva minden Python Databricks Connect-verzióhoz. Python virtuális környezetek segítenek meggyőződni arról, hogy a Python és a Databricks Connect megfelelő verzióit használja együtt. További információ ezekről az eszközökről és azok aktiválásáról: venv vagy Poetry.

A Databricks Connect-ügyfél telepítése

Ez a szakasz bemutatja, hogyan telepítheti a Databricks Connect-ügyfeleta Venv vagy a Poetry használatával.

Megjegyzés

Ha már telepítve van Visual Studio Code Databricks-bővítménye, a Databricks Runtime 13.3 LTS-hez készült Databricks Connectet a bővítmény használatával telepítheti. Lásd: A Databricks Connect használatával történő kódhibakeresés a Databricks-kiterjesztéshez a Visual Studio Code szoftverhez.

A Databricks Connect-ügyfél telepítése a venv használatával

  1. Ha a virtuális környezet aktiválva van, távolítsa el a PySparkot, ha már telepítve van, a uninstall parancs futtatásával. Erre azért van szükség, mert a csomag ütközik a databricks-connect PySparkkal. További részletekért lásd : Ütköző PySpark-telepítések. Annak ellenőrzéséhez, hogy a PySpark már telepítve van-e, futtassa a show parancsot.

    # Is PySpark already installed?
    pip3 show pyspark
    
    # Uninstall PySpark
    pip3 uninstall pyspark
    
  2. Ha a virtuális környezet továbbra is aktiválva van, telepítse a Databricks Connect-ügyfelet a install parancs futtatásával. Ezzel a --upgrade beállítással frissítheti a meglévő ügyféltelepítéseket a megadott verzióra.

    pip3 install --upgrade "databricks-connect==17.3.*"  # Or X.Y.* to match your cluster version.
    

    Megjegyzés

    A Databricks azt javasolja, hogy a „pont-csillag” jelölést fűzze hozzá databricks-connect==X.Y.* helyett databricks-connect=X.Y-hez annak érdekében, hogy a legújabb csomag kerüljön telepítésre. Bár ez nem követelmény, az elősegíti, hogy kihasználhassa a fürt legújabb támogatott funkcióinak használatát.

A Databricks Connect-ügyfél telepítése a Poetryvel

  1. Ha a virtuális környezet aktiválva van, távolítsa el a PySparkot, ha már telepítve van, a remove parancs futtatásával. Erre azért van szükség, mert a csomag ütközik a databricks-connect PySparkkal. További részletekért lásd : Ütköző PySpark-telepítések. Annak ellenőrzéséhez, hogy a PySpark már telepítve van-e, futtassa a show parancsot.

    # Is PySpark already installed?
    poetry show pyspark
    
    # Uninstall PySpark
    poetry remove pyspark
    
  2. Ha a virtuális környezet továbbra is aktiválva van, telepítse a Databricks Connect-ügyfelet a add parancs futtatásával.

    poetry add databricks-connect@~17.3  # Or X.Y to match your cluster version.
    

    Megjegyzés

    A Databricks azt javasolja, hogy az "at-tilde" jelölést használja databricks-connect@~17.3 megadásához ahelyett databricks-connect==17.3, hogy biztosítsa a legújabb csomag telepítését. Bár ez nem követelmény, az elősegíti, hogy kihasználhassa a fürt legújabb támogatott funkcióinak használatát.