Поделиться через


Средства разработчика

Databricks предоставляет экосистему средств для разработки приложений и решений, которые интегрируются с Azure Databricks и программно управляют ресурсами и данными Databricks.

В этой статье представлен обзор этих средств и рекомендаций по лучшим средствам для распространенных сценариев разработчика.

Какие средства предоставляют Databricks для разработчиков?

В следующей таблице приведен список средств разработчика, предоставляемых Databricks.

Средство Description
Проверка подлинности и авторизация Настройте проверку подлинности и авторизацию для средств, сценариев и приложений для работы с Azure Databricks.
Databricks Connect Подключитесь к Azure Databricks с помощью популярных интегрированных сред разработки (IDEs), таких как PyCharm, IntelliJ IDEA, Eclipse, RStudio и JupyterLab.

Если вы используете Visual Studio Code, Databricks рекомендует расширение Databricks для Visual Studio Code, созданное на основе Databricks Connect, так как предоставляет дополнительные функции для упрощения настройки.
Расширение Databricks для Visual Studio Code Подключитесь к удаленным рабочим областям Azure Databricks из интегрированной среды разработки Visual Studio Code (IDE).
Подключаемый модуль PyCharm Databricks Настройте подключение к удаленной рабочей области Databricks и запустите файлы в кластерах Databricks из PyCharm. Этот подключаемый модуль разработан и предоставляется JetBrains в партнерстве с Databricks.
Пакеты SDK databricks Автоматизация Azure Databricks из библиотек кода, написанных для популярных языков, таких как Python, Java, Go и R. Вместо отправки вызовов REST API непосредственно с помощью curl/Postman можно использовать пакет SDK для взаимодействия с Databricks с помощью выбранного языка программирования.
Драйверы и средства SQL Подключитесь к Azure Databricks для выполнения команд и скриптов SQL, программного взаимодействия с Azure Databricks и интеграции функций SQL Azure Databricks в приложения, написанные на популярных языках, таких как Python, Go, JavaScript и TypeScript.
CLI Databricks Доступ к функциям Azure Databricks с помощью интерфейса командной строки Databricks (CLI). Интерфейс командной строки упаковывает REST API Databricks, поэтому вместо отправки вызовов REST API непосредственно с помощью curl или Postman можно использовать интерфейс командной строки Databricks для взаимодействия с Databricks.
Пакеты активов Databricks Реализуйте рекомендации по разработке, тестированию и развертыванию (CI/CD) для данных Azure Databricks и проектов ИИ с помощью пакетов ресурсов Databricks (DAB).
Поставщик Databricks Terraform и Terraform CDKTF для Databricks Подготовка инфраструктуры и ресурсов Azure Databricks с помощью Terraform.
Поставщик ресурсов Pulumi Databricks Подготовка инфраструктуры и ресурсов Azure Databricks с помощью инфраструктуры Pulumi как кода (IaC).
Средства CI/CD Интеграция популярных систем CI/CD и платформ, таких как GitHub Actions, Jenkins и Apache Airflow.

Совет

Вы также можете подключить множество дополнительных популярных сторонних средств к кластерам и хранилищам SQL для доступа к данным в Azure Databricks. Ознакомьтесь с партнерами по технологиям.

Какое средство разработчика следует использовать?

В следующей таблице приведены рекомендации по инструменту Databricks для распространенных сценариев разработчика.

Сценарии Рекомендация
— интерактивная разработка и отладка из локальной интегрированной среды разработки Расширение Databricks для Visual Studio Code

Подключаемый модуль PyCharm Databricks

Для других удостоверений используйте интерфейс командной строки Databricks с Databricks Connect
— прямое взаимодействие с Databricks из командной строки
— скрипты оболочки
-Экспериментирование
— Вызов REST API напрямую
— управление профилями локальной проверки подлинности
— Синхронизация кода из интегрированной среды разработки с рабочей областью Databricks
CLI Databricks
— управление рабочими процессами и развертывание проектов в Databricks
— Применение рекомендаций CI/CD
— совместное развертывание ресурсов и ресурсов в виде одного урока, совместное создание и развертывание ресурсов
— Поддерживает наиболее распространенные ресурсы
Наборы активов Databricks (функция интерфейса командной строки)
— инфраструктура как код, CI/CD
— администрирование и создание рабочих областей, каталогов, хранилищ метаданных и применение разрешений
— гарантирует переносимость среды и аварийное восстановление
— многие поддерживаемые ресурсы
Поставщик Terraform для Databricks
— разработка приложений
— интеграция с существующими системами развертывания
— создание пользовательских рабочих процессов Databricks и новых веб-служб
Databricks Python SDK

Databricks Java SDK

Databricks Go SDK

Databricks R SDK
— только расширенные сценарии
— Почти все ресурсы Databricks доступны
REST API Databricks