Ескертпе
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Жүйеге кіруді немесе каталогтарды өзгертуді байқап көруге болады.
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Каталогтарды өзгертуді байқап көруге болады.
Примечание.
В этой статье рассматриваются Databricks Connect для Databricks Runtime 13.3 LTS и более поздних версий.
В этой статье описывается установка Databricks Connect для Python. См. раздел "Что такое Databricks Connect?".
Требования
Перед установкой Databricks Connect убедитесь, что рабочая область и локальная среда соответствуют требованиям. См. сведения о требованиях к использованию Databricks Connect.
Активация виртуальной среды Python
Databricks настоятельно рекомендует активировать виртуальную среду Python для каждой версии Python, которая используется с Databricks Connect. Виртуальные среды Python помогают убедиться, что вы используете правильные версии Python и Databricks Connect вместе. Дополнительные сведения об этих инструментах и их активации см . в venv или поэзии.
Установка клиента Databricks Connect
В этом разделе описывается, как установить клиент Databricks Connect, используя venv или Poetry.
Примечание.
Если у вас уже установлено расширение Databricks для Visual Studio Code, можно установить Databricks Connect для Databricks Runtime 13.3 LTS и выше с помощью расширения. Смотрите Отладка кода с использованием Databricks Connect для расширения Databricks для Visual Studio Code.
Установка клиента Databricks Connect с помощью venv
После активации виртуальной среды удалите PySpark, если оно уже установлено, выполнив
uninstallкоманду. Это необходимо, так как пакетdatabricks-connectконфликтует с PySpark. Дополнительные сведения см. в разделе Конфликтующие установки PySpark. Чтобы проверить, установлен ли PySpark, выполнитеshowкоманду.# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pysparkПри активации виртуальной среды установите клиент Databricks Connect, выполнив
installкоманду.--upgradeИспользуйте параметр для обновления любой существующей установки клиента до указанной версии.pip3 install --upgrade "databricks-connect==17.3.*" # Or X.Y.* to match your cluster version.Примечание.
Databricks рекомендует добавить нотацию dot-asterisk, чтобы указать
databricks-connect==X.Y.*вместо нееdatabricks-connect=X.Y, чтобы убедиться, что установлен последний пакет. Хотя это не является обязательным требованием, он помогает убедиться, что вы можете использовать последние поддерживаемые функции для этого кластера.
Установка клиента Databricks Connect с помощью поэзии
После активации виртуальной среды удалите PySpark, если оно уже установлено, выполнив
removeкоманду. Это необходимо, так как пакетdatabricks-connectконфликтует с PySpark. Дополнительные сведения см. в разделе Конфликтующие установки PySpark. Чтобы проверить, установлен ли PySpark, выполнитеshowкоманду.# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pysparkПри активации виртуальной среды установите клиент Databricks Connect, выполнив
addкоманду.poetry add databricks-connect@~17.3 # Or X.Y to match your cluster version.Примечание.
Databricks рекомендует использовать нотацию at-tilde, чтобы указать
databricks-connect@~17.3вместо нееdatabricks-connect==17.3, чтобы убедиться, что последний пакет установлен. Хотя это не является обязательным требованием, он помогает убедиться, что вы можете использовать последние поддерживаемые функции для этого кластера.