Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Poznámka:
Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.
Tento článek popisuje, jak nainstalovat Databricks Connect pro Python. Podívejte se, co je Databricks Connect?
Požadavky
Před instalací Databricks Connect se ujistěte, že váš pracovní prostor a místní prostředí splňují požadavky. Viz požadavky na využití Databricks Connect.
Aktivace virtuálního prostředí Pythonu
Databricks důrazně doporučuje, abyste pro každou verzi Pythonu, kterou používáte s Databricks Connect, aktivovalo virtuální prostředí Pythonu. Virtuální prostředí Pythonu pomáhají zajistit, abyste společně používali správné verze Pythonu a Databricks Connect. Další informace o těchto nástrojích a o tom, jak je aktivovat, najdete v tématu venv nebo Báseň.
Instalace klienta Databricks Connect
Tato část popisuje, jak nainstalovat klienta Databricks Connect s venv nebo Poetry.
Poznámka:
Pokud už máte nainstalované rozšíření Databricks pro Visual Studio Code, můžete pomocí rozšíření nainstalovat Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.
Instalace klienta Databricks Connect s venvem
Po aktivaci virtuálního prostředí odinstalujte PySpark spuštěním
uninstallpříkazu. To je povinné, protožedatabricks-connectbalíček je v konfliktu s PySpark. Podrobnosti najdete v tématu Konfliktní instalace PySpark. Pokud chcete zkontrolovat, jestli je PySpark už nainstalovaný, spusťteshowpříkaz.# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pysparkPokud je vaše virtuální prostředí stále aktivované, nainstalujte klienta Databricks Connect spuštěním
installpříkazu.--upgradePomocí možnosti upgradujte jakoukoli existující instalaci klienta na zadanou verzi.pip3 install --upgrade "databricks-connect==16.4.*" # Or X.Y.* to match your cluster version.Poznámka:
Databricks doporučuje, abyste místo něj
databricks-connect==X.Y.*databricks-connect=X.Ypřipojili notaci dot-asterisk, abyste měli jistotu, že je nainstalovaný nejnovější balíček. I když to není požadavek, pomůže vám to zajistit, abyste pro tento cluster mohli používat nejnovější podporované funkce.
Instalace klienta Databricks Connect s poetií
Po aktivaci virtuálního prostředí odinstalujte PySpark spuštěním
removepříkazu. To je povinné, protožedatabricks-connectbalíček je v konfliktu s PySpark. Podrobnosti najdete v tématu Konfliktní instalace PySpark. Pokud chcete zkontrolovat, jestli je PySpark už nainstalovaný, spusťteshowpříkaz.# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pysparkPokud je vaše virtuální prostředí stále aktivované, nainstalujte klienta Databricks Connect spuštěním
addpříkazu.poetry add databricks-connect@~16.4 # Or X.Y to match your cluster version.Poznámka:
Databricks doporučuje, abyste místo
databricks-connect@~16.4databricks-connect==16.4toho použili notaci at-tilde, abyste měli jistotu, že je nainstalovaný nejnovější balíček. I když to není požadavek, pomůže vám to zajistit, abyste pro tento cluster mohli používat nejnovější podporované funkce.