Отладка кода с помощью Databricks Connect для расширения Databricks для Visual Studio Code

В этой статье описывается, как использовать интеграцию Databricks Connect в расширении Databricks для Visual Studio Code для запуска и отладки отдельных файлов Python (.py). Дополнительные сведения о расширении см. в разделе Databricks extension for Visual Studio Code.

Интеграция Databricks Connect также позволяет запускать и отлаживать ячейки блокнота. См. статью Запуск и отладка ячеек ноутбука с помощью Databricks Connect и расширения Databricks для Visual Studio Code.

Требования

Прежде чем использовать Databricks Connect из расширения Databricks для Visual Studio Code, необходимо сначала выполнить требования Databricks Connect. К этим требованиям относятся такие требования, как рабочая область с поддержкой каталога Unity, требования к вычислениям и требования к версии для локальной установки Python.

Активация виртуальной среды Python

Активируйте среду Python virtual для проекта Python. Python виртуальные среды помогают убедиться, что проект использует совместимые версии Python и пакетов Python (в данном случае: пакет Databricks Connect).

В области Конфигурации:

  1. Щелкните красный элемент Activate Virtual Environment в разделе Python Environment.
  2. В палитре команд выберите Venv или Conda.
  3. Выберите зависимости, которые требуется установить, если таковые имеются.

Установка Databricks Connect

В представлении Configuration в разделе Python Environment:

  1. Нажмите красную кнопку "Установить databricks-connect play".
  2. Подключите кластер.
    • Если раздел кластера еще не настроен в расширении, появится следующее сообщение: "Подключите кластер для использования Databricks Connect". Нажмите Подключить кластер и выберите кластер, соответствующий требованиям Databricks Connect.
    • Если настроен раздел кластера , но кластер несовместим с Databricks Connect, нажмите красную кнопку Databricks Connect, отключенную, нажмите кнопку Подключить кластери выберите совместимый кластер.
  3. Если пакет Databricks Connect (и его зависимости) еще не установлен, появится следующее сообщение: "Для интерактивной отладки и автозаполнения требуется Databricks Connect. Вы бы хотели установить его в среде <environment-name>? Щелкните Установить.
  4. В строке состояния Visual Studio Code, если появится красная кнопка Databricks Connect отключена, щелкните ее и выполните инструкции на экране, чтобы включить его.
  5. После появления кнопки Databricks Connect вы можете использовать Databricks Connect.

Примечание.

При использовании Poetry вы можете синхронизировать файлы pyproject.toml и poetry.lock с установленным пакетом Databricks Connect и его зависимостями, выполнив следующую команду. Обязательно замените 16.4.1 версией пакета Databricks Connect, которая соответствует той, что была установлена расширением Databricks для Visual Studio Code вашего проекта.

poetry add databricks-connect==16.4.1

Запустите или отладьте свой код на Python.

После включения Databricks Connect запустите или отладите файл Python (.py):

  1. В проекте откройте файл Python, который требуется запустить или отлаживать.

  2. Задайте все точки останова отладки в файле Python.

  3. Щелкните значок Запустить в Databricks рядом со списком вкладок редактора, а затем щелкните Отладка текущего файла с помощью Databricks Connect.

    Отладка текущего файла из значка

    Выходные данные отображаются в Консоли отладки.

    Вы также можете щелкнуть правой кнопкой мыши файл .py, а затем нажать кнопку Запустить в Databricks>, Отладка текущего файла с помощью Databricks Connect.

    Отладка текущего файла из контекстного меню