Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Примечание.
В этой статье рассматриваются Databricks Connect для Databricks Runtime 13.3 LTS и более поздних версий.
В этой статье описывается установка Databricks Connect для Python. См. раздел "Что такое Databricks Connect?".
Требования
Перед установкой Databricks Connect убедитесь, что рабочая область и локальная среда соответствуют требованиям. См. сведения о требованиях к использованию Databricks Connect.
Активация виртуальной среды Python
Databricks настоятельно рекомендует активировать виртуальную среду Python для каждой версии Python, которая используется с Databricks Connect. Виртуальные среды Python помогают убедиться, что вы используете правильные версии Python и Databricks Connect вместе. Дополнительные сведения об этих инструментах и их активации см . в venv или поэзии.
Установка клиента Databricks Connect
В этом разделе описывается, как установить клиент Databricks Connect, используя venv или Poetry.
Примечание.
Если у вас уже установлено расширение Databricks для Visual Studio Code, можно установить Databricks Connect для Databricks Runtime 13.3 LTS и выше с помощью расширения. Смотрите Отладка кода с использованием Databricks Connect для расширения Databricks для Visual Studio Code.
Установка клиента Databricks Connect с помощью venv
После активации виртуальной среды удалите PySpark, если оно уже установлено, выполнив
uninstallкоманду. Это необходимо, так как пакетdatabricks-connectконфликтует с PySpark. Дополнительные сведения см. в разделе Конфликтующие установки PySpark. Чтобы проверить, установлен ли PySpark, выполнитеshowкоманду.# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pysparkПри активации виртуальной среды установите клиент Databricks Connect, выполнив
installкоманду.--upgradeИспользуйте параметр для обновления любой существующей установки клиента до указанной версии.pip3 install --upgrade "databricks-connect==17.3.*" # Or X.Y.* to match your cluster version.Примечание.
Databricks рекомендует добавить нотацию dot-asterisk, чтобы указать
databricks-connect==X.Y.*вместо нееdatabricks-connect=X.Y, чтобы убедиться, что установлен последний пакет. Хотя это не является обязательным требованием, он помогает убедиться, что вы можете использовать последние поддерживаемые функции для этого кластера.
Установка клиента Databricks Connect с помощью поэзии
После активации виртуальной среды удалите PySpark, если оно уже установлено, выполнив
removeкоманду. Это необходимо, так как пакетdatabricks-connectконфликтует с PySpark. Дополнительные сведения см. в разделе Конфликтующие установки PySpark. Чтобы проверить, установлен ли PySpark, выполнитеshowкоманду.# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pysparkПри активации виртуальной среды установите клиент Databricks Connect, выполнив
addкоманду.poetry add databricks-connect@~17.3 # Or X.Y to match your cluster version.Примечание.
Databricks рекомендует использовать нотацию at-tilde, чтобы указать
databricks-connect@~17.3вместо нееdatabricks-connect==17.3, чтобы убедиться, что последний пакет установлен. Хотя это не является обязательным требованием, он помогает убедиться, что вы можете использовать последние поддерживаемые функции для этого кластера.