Instalace služby Databricks Connect pro Python

Poznámka:

Tento článek se zabývá Databricks Connect pro Databricks Runtime verze 13.3 LTS a novější.

Tento článek popisuje, jak nainstalovat Databricks Connect pro Python. Viz Databricks Connect.

Požadavky

Před instalací Databricks Connect se ujistěte, že váš pracovní prostor a místní prostředí splňují požadavky. Viz požadavky na využití Databricks Connect.

Aktivace virtuálního prostředí Python

Databricks důrazně doporučuje, abyste měli aktivované Python virtuální prostředí pro každou verzi Python, kterou používáte s Databricks Connect. Virtuální prostředí Pythonu vám pomáhají zajistit, že spolu používáte správné verze Pythonu a Databricks Connect. Další informace o těchto nástrojích a o tom, jak je aktivovat, najdete v tématu venv nebo Báseň.

Instalace klienta Databricks Connect

Tato část popisuje, jak nainstalovat klienta Databricks Connect s venv nebo Poetry.

Poznámka:

Pokud už máte nainstalované rozšíření Databricks pro Visual Studio Code, můžete pomocí rozšíření nainstalovat Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší. Viz kód Debug pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.

Instalace klienta Databricks Connect s venvem

  1. Po aktivaci virtuálního prostředí odinstalujte PySpark spuštěním uninstall příkazu. To je povinné, protože databricks-connect balíček je v konfliktu s PySpark. Podrobnosti najdete v tématu Konfliktní instalace PySpark. Pokud chcete zkontrolovat, jestli je PySpark už nainstalovaný, spusťte show příkaz.

    # Is PySpark already installed?
    pip3 show pyspark
    
    # Uninstall PySpark
    pip3 uninstall pyspark
    
  2. Pokud je vaše virtuální prostředí stále aktivované, nainstalujte klienta Databricks Connect spuštěním install příkazu. --upgrade Pomocí možnosti upgradujte jakoukoli existující instalaci klienta na zadanou verzi.

    pip3 install --upgrade "databricks-connect==17.3.*"  # Or X.Y.* to match your cluster version.
    

    Poznámka:

    Databricks doporučuje připojit notaci „dot-asterisk“ k specifikaci databricks-connect==X.Y.* místo databricks-connect=X.Y, abyste měli jistotu, že je nainstalován nejnovější balíček. I když to není požadavek, pomůže vám to zajistit, abyste pro tento cluster mohli používat nejnovější podporované funkce.

Instalace klienta Databricks Connect s použitím Poetry

  1. Po aktivaci virtuálního prostředí odinstalujte PySpark spuštěním remove příkazu. To je povinné, protože databricks-connect balíček je v konfliktu s PySpark. Podrobnosti najdete v tématu Konfliktní instalace PySpark. Pokud chcete zkontrolovat, jestli je PySpark už nainstalovaný, spusťte show příkaz.

    # Is PySpark already installed?
    poetry show pyspark
    
    # Uninstall PySpark
    poetry remove pyspark
    
  2. Pokud je vaše virtuální prostředí stále aktivované, nainstalujte klienta Databricks Connect spuštěním add příkazu.

    poetry add databricks-connect@~17.3  # Or X.Y to match your cluster version.
    

    Poznámka:

    Databricks doporučuje, abyste použili notaci „at-tilde” pro specifikaci databricks-connect@~17.3 místo databricks-connect==17.3, abyste měli jistotu, že je nainstalován nejnovější balíček. I když to není požadavek, pomůže vám to zajistit, abyste pro tento cluster mohli používat nejnovější podporované funkce.