注
この記事では、Databricks Runtime 13.3 LTS 以上用の Databricks Connect について説明します。
この記事では、Databricks Connect for Pythonをインストールする方法について説明します。 「Databricks Connect」を参照してください。
要件
Databricks Connect をインストールする前に、ワークスペースとローカル環境が要件を満たしていることを確認してください。 Databricks Connect の使用要件を参照してください。
Python仮想環境をアクティブ化する
Databricks では、Databricks Connect で使用するPythonバージョンごとに Python virtual 環境をアクティブにすることを強くお勧めします。 Python仮想環境は、Pythonと Databricks Connect の正しいバージョンを一緒に使用していることを確認するのに役立ちます。 これらのツールとそのアクティブ化方法の詳細については、venv または Poetry に関するページを参照してください。
Databricks Connect クライアントをインストールする
このセクションでは、Venv または詩を使用して Databricks Connect クライアントをインストールする方法について説明します。
注
Visual Studio Code用のDatabricks拡張機能が既にインストールされている場合は、その拡張機能を使用して、Databricks Runtime 13.3 LTS以降に対応するDatabricks Connectをインストールできます。 Visual Studio Code の Databricks 拡張機能の Databricks Connect を使用した
venv を使用して Databricks Connect クライアントをインストールする
仮想環境がアクティブな状態で、
uninstallコマンドを実行して PySpark をアンインストールします (既にインストールされている場合)。 これは、databricks-connectパッケージが PySpark と競合するために必要です。 詳細については、「PySpark インストールの競合」を参照してください。 PySpark が既にインストールされているかどうかを調べるには、showコマンドを実行します。# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pyspark仮想環境がアクティブな状態のままで、
installコマンドを実行して Databricks Connect クライアントをインストールします。 既存のクライアント インストールを指定バージョンにアップグレードするには、--upgradeオプションを使用します。pip3 install --upgrade "databricks-connect==17.3.*" # Or X.Y.* to match your cluster version.注
Databricks では、最新のパッケージがインストールされるように、
databricks-connect==X.Y.*ではなくdatabricks-connect=X.Yを指定する "ドットとアスタリスク" の表記を追加することをお勧めしています。 これは要件ではありませんが、そのクラスターでサポートされている最新の機能を使用できるようにするために役立ちます。
Poetry を使用して Databricks Connect クライアントをインストールする
仮想環境がアクティブな状態で、
removeコマンドを実行して PySpark をアンインストールします (既にインストールされている場合)。 これは、databricks-connectパッケージが PySpark と競合するために必要です。 詳細については、「PySpark インストールの競合」を参照してください。 PySpark が既にインストールされているかどうかを調べるには、showコマンドを実行します。# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pyspark仮想環境がアクティブな状態のままで、
addコマンドを実行して Databricks Connect クライアントをインストールします。poetry add databricks-connect@~17.3 # Or X.Y to match your cluster version.注
Databricks では、最新のパッケージがインストールされるように、
databricks-connect@~17.3Databricks ではなくdatabricks-connect==17.3を指定する "アットとチルダ" の表記を使うことをお勧めしています。 これは要件ではありませんが、そのクラスターでサポートされている最新の機能を使用できるようにするために役立ちます。