Compartir a través de


Herramientas de desarrollo local

Databricks proporciona un ecosistema de herramientas para ayudarle a desarrollar aplicaciones y soluciones que se integran con Azure Databricks y administran mediante programación los recursos y los datos de Databricks.

En este artículo se proporciona información general sobre estas herramientas y recomendaciones para las mejores herramientas para escenarios comunes para desarrolladores.

¿Qué herramientas proporciona Databricks para desarrollar localmente?

En la tabla siguiente se proporciona una lista de las herramientas de desarrollo proporcionadas por Databricks.

Herramienta Descripción
Autenticación y autorización Configure la autenticación y autorización para que las herramientas, scripts y aplicaciones funcionen con Azure Databricks.
Databricks Connect Conéctese a Azure Databricks mediante entornos de desarrollo integrados (IDE) populares, como PyCharm, IntelliJ IDEA, Eclipse, RStudio y JupyterLab.
Si usa Visual Studio Code, Databricks recomienda la extensión de Databricks para Visual Studio Code, que se basa en Databricks Connect, ya que proporciona características adicionales para facilitar la configuración.
Extensión de Databricks para Visual Studio Code Conéctese a las áreas de trabajo remotas de Azure Databricks desde el entorno de desarrollo integrado (IDE) de Visual Studio Code .
Extensión PyCharm Databricks Configure una conexión a un área de trabajo remota de Databricks y ejecute archivos en clústeres de Databricks desde PyCharm. Este complemento es desarrollado y proporcionado por JetBrains en colaboración con Databricks.
SDK de Databricks Automatice Azure Databricks desde bibliotecas de código escritas para lenguajes populares, como Python, Java, Go y R. En lugar de enviar llamadas a la API REST directamente mediante curl/ Postman, puede usar un SDK para interactuar con Databricks mediante un lenguaje de programación que prefiera. Los SDK de Databricks admiten la API de REST completa y proporcionan otras características, incluida la autenticación unificada y la paginación, que facilitan su uso y ampliación para abordar muchos escenarios.
Herramientas y controladores de SQL Conéctese a Azure Databricks para ejecutar secuencias de comandos y comandos SQL, interactuar mediante programación con Azure Databricks e integrar la funcionalidad de SQL de Azure Databricks en aplicaciones escritas en lenguajes populares, como Python, Go, JavaScript y TypeScript.
CLI de Databricks Acceda a la funcionalidad de Azure Databricks mediante la interfaz de la línea de comandos (CLI) de Databricks. La CLI encapsula la API REST de Databricks, por lo que, en lugar de enviar llamadas a la API REST directamente mediante curl o Postman, puede usar la CLI de Databricks para interactuar con Databricks.
Conjuntos de recursos de Databricks Implemente procedimientos recomendados de desarrollo, pruebas e implementación (CI/CD) estándar del sector para los proyectos de inteligencia artificial y datos de Azure Databricks mediante Conjuntos de recursos de Databricks.
Proveedor de Databricks Terraform y Terraform CDKTF para Databricks Aprovisione la infraestructura y los recursos de Azure Databricks mediante Terraform.
Herramientas de CI/CD Integre sistemas y marcos de CI/CD populares, como Acciones de GitHub, Jenkins y Apache Airflow.

Sugerencia

Puede conectar también numerosas herramientas conocidas adicionales de terceros a clústeres y almacenes de SQL para acceder a los datos de Azure Databricks. Consulte a los Socios tecnológicos.

¿Qué herramienta de desarrollador debo usar?

En la tabla siguiente se describen las recomendaciones de herramientas de Databricks para escenarios comunes para desarrolladores.

Herramienta Recomendación de uso
Extensión de Databricks para Visual Studio Code
Extensión PyCharm Databricks
Para otros IDEs, use la CLI de Databricks con Databricks Connect
  • Desarrollo e depuración interactivos desde un IDE local
CLI de Databricks
  • Interacción directa con Databricks desde la línea de comandos
  • Scripting de shell
  • Experimentación
  • Invocación de la API REST directamente
  • Administración de perfiles de autenticación local
  • Sincronización de código desde el IDE al área de trabajo de Databricks
Conjuntos de recursos de Databricks (una característica de la CLI)
  • Administración de flujos de trabajo e implementación de proyectos en Databricks
  • Aplicar las mejores prácticas de CI/CD
  • Co-versión, co-autoría, co-implementación de sus recursos y activos como una sola unidad
  • Admite los recursos más comunes
Proveedor Databricks Terraform
  • Infraestructura como código, CI/CD
  • Administración y creación de áreas de trabajo, catálogos, metastores y aplicación de permisos
  • Garantizar la portabilidad del entorno y la recuperación ante desastres
  • Muchos recursos admitidos
Databricks Python SDK
Databricks Java SDK
Databricks Go SDK
Databricks R SDK
  • Desarrollo de aplicaciones
  • Integración con sistemas de implementación existentes
  • Creación de flujos de trabajo personalizados de Databricks y nuevos servicios web
Controladores SQL
  • Ejecución de comandos y scripts de SQL desde aplicaciones cliente
API REST de Databricks
  • Automatización de procesos en los que un SDK del lenguaje de programación preferido no está disponible
  • Solo escenarios avanzados
  • Casi todos los recursos de Databricks están disponibles