Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье описывается, как использовать интеграцию Databricks Connect в расширении Databricks для Visual Studio Code для запуска и отладки отдельных файлов Python (.py). Дополнительные сведения о расширении см. в разделе Databricks extension for Visual Studio Code.
Интеграция Databricks Connect также позволяет запускать и отлаживать ячейки блокнота. См. статью Запуск и отладка ячеек ноутбука с помощью Databricks Connect и расширения Databricks для Visual Studio Code.
Требования
Прежде чем использовать Databricks Connect из расширения Databricks для Visual Studio Code, необходимо сначала выполнить требования Databricks Connect. К этим требованиям относятся такие требования, как рабочая область с поддержкой каталога Unity, требования к вычислениям и требования к версии для локальной установки Python.
Активация виртуальной среды Python
Активируйте среду Python virtual для проекта Python. Python виртуальные среды помогают убедиться, что проект использует совместимые версии Python и пакетов Python (в данном случае: пакет Databricks Connect).
В области Конфигурации:
- Щелкните красный элемент Activate Virtual Environment в разделе Python Environment.
- В палитре команд выберите Venv или Conda.
- Выберите зависимости, которые требуется установить, если таковые имеются.
Установка Databricks Connect
В представлении Configuration в разделе Python Environment:
- Нажмите красную кнопку "Установить databricks-connect play".
- Подключите кластер.
- Если раздел кластера еще не настроен в расширении, появится следующее сообщение: "Подключите кластер для использования Databricks Connect". Нажмите Подключить кластер и выберите кластер, соответствующий требованиям Databricks Connect.
- Если настроен раздел кластера
, но кластер несовместим с Databricks Connect, нажмите красную кнопку Databricks Connect, отключенную , нажмите кнопкуПодключить кластер и выберите совместимый кластер.
- Если пакет Databricks Connect (и его зависимости) еще не установлен, появится следующее сообщение: "Для интерактивной отладки и автозаполнения требуется Databricks Connect. Вы бы хотели установить его в среде
<environment-name>? Щелкните Установить. - В строке состояния Visual Studio Code, если появится красная кнопка Databricks Connect отключена, щелкните ее и выполните инструкции на экране, чтобы включить его.
- После появления кнопки Databricks Connect вы можете использовать Databricks Connect.
Примечание.
При использовании Poetry вы можете синхронизировать файлы pyproject.toml и poetry.lock с установленным пакетом Databricks Connect и его зависимостями, выполнив следующую команду. Обязательно замените 16.4.1 версией пакета Databricks Connect, которая соответствует той, что была установлена расширением Databricks для Visual Studio Code вашего проекта.
poetry add databricks-connect==16.4.1
Запустите или отладьте свой код на Python.
После включения Databricks Connect запустите или отладите файл Python (.py):
В проекте откройте файл Python, который требуется запустить или отлаживать.
Задайте все точки останова отладки в файле Python.
Щелкните значок Запустить в Databricks рядом со списком вкладок редактора, а затем щелкните Отладка текущего файла с помощью Databricks Connect.
Выходные данные отображаются в Консоли отладки.
Вы также можете щелкнуть правой кнопкой мыши файл
.py, а затем нажать кнопку Запустить в Databricks>, Отладка текущего файла с помощью Databricks Connect.