Nota
L'accés a aquesta pàgina requereix autorització. Pots provar d'iniciar sessió o canviar de directori.
L'accés a aquesta pàgina requereix autorització. Pots provar de canviar directoris.
La extensión databricks para Visual Studio Code le permite conectarse a las áreas de trabajo remotas de Azure Databricks desde Visual Studio Code o cursor en la máquina de desarrollo local. Luego, puede:
- Defina, implemente y ejecute conjuntos de recursos de Databricks para aplicar patrones de CI/CD y procedimientos recomendados a los trabajos de Lakeflow, las canalizaciones declarativas de Spark de Lakeflow y las pilas de MLOps mediante la interfaz de usuario de Visual Studio Code. Vea ¿Qué son las Agrupaciones de recursos de Databricks? y Características de extensión de Agrupaciones de recursos de Databricks.
- Ejecute archivos locales de código Python desde Visual Studio Code en sus áreas de trabajo remotas utilizando clústeres de Azure Databricks o computación sin servidor. Consulte Ejecución de un archivo de Python en un clúster.
- Ejecute archivos de código de Python locales (
.py) y cuadernos de Python, R, Scala y SQL (.py,.ipynb,.r,.scala, y.sql) desde Visual Studio Code como trabajos de Lakeflow en los entornos de trabajo remotos. Vea Ejecución de un archivo de Python como trabajo. - Configure el entorno de depuración y Databricks Connect mediante una lista de comprobación sencilla que desencadena diálogos de selección. Vea Depuración de código mediante Databricks Connect para la extensión de Databricks para Visual Studio Code.
- Depure celdas de cuadernos por celda dentro de Visual Studio Code con Databricks Connect. Vea Ejecución y depuración de celdas de cuaderno con Databricks Connect mediante la extensión de Databricks para Visual Studio Code.
- Sincronice el código local que desarrolle en Visual Studio Code con código en las áreas de trabajo remotas. Consulte Sincronización de la carpeta del área de trabajo con Databricks
Nota:
La extensión de Databricks para Visual Studio Code admite la ejecución de cuadernos de R, Scala y SQL como trabajos automatizados, pero no proporciona ninguna compatibilidad más profunda con estos lenguajes dentro de Visual Studio Code.
Introducción
A fin de empezar a usar la extensión de Databricks para Visual Studio Code:
- Instale la extensión.
- Crear un nuevo proyecto de Databricks o convertir un proyecto de Visual Studio Code existente.
- Configure el proyecto fácilmente mediante la interfaz de usuario de la extensión de Databricks.
- Ejecute código de Python como parte del tutorial de extensión.
- Depure el código mediante la integración de Databricks Connect.
- Pruebe el código mediante
pytest. Consulte Ejecución de pruebas de Python mediante la extensión Databricks para Visual Studio Code.
Creación de un nuevo proyecto de Databricks
Una vez instalada la extensión, puede crear un proyecto de Databricks mediante la extensión de Databricks para Visual Studio Code:
- Inicie Visual Studio Code.
- En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
- Haga clic en Crear un nuevo proyecto.
- En la Paleta de comandos, seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de la autorización para la extensión de Databricks para Visual Studio Code.
- En Proporcionar una ruta de acceso a una carpeta en la que quiere que esté el nuevo proyecto, escriba la ruta de acceso a una carpeta en el equipo de desarrollo local donde quiera crear el proyecto o haga clic en el cuadro de diálogo Abrir selección de carpetas y seleccione la ruta de acceso a la carpeta del proyecto.
- En Plantilla que se va a usar en la vista de inicialización del proyecto de Databricks, use las flechas arriba y abajo para seleccionar una plantilla de proyecto y presione Entrar. Para obtener información sobre las plantillas de proyecto de agrupaciones de Databricks, consulta Plantillas de proyecto de agrupación de recursos de Databricks.
- Para el proyecto, escriba un Nombre único para este proyecto o deje el nombre de proyecto predeterminado de
my_projecty luego presione Entrar. - Elija si quiere agregar un cuaderno de código auxiliar (ejemplo), una canalización de Delta Live Tables (ejemplo) o un paquete de Python de código auxiliar (ejemplo) al proyecto, o cualquier combinación de estos códigos auxiliares (ejemplos).
- Presione cualquier tecla para cerrar la pestaña del editor Inicialización del proyecto de Databricks.
- En Seleccionar el proyecto que quiere abrir, elija el proyecto que acaba de crear.
Apertura de un proyecto existente de Agrupaciones de recursos de Databricks
Un proyecto de Conjuntos de activos de Databricks tiene un databricks.yml archivo en la carpeta raíz del proyecto. Consulta Configuración de agrupaciones de recursos de Databricks. Si desea usar la extensión con un proyecto de Conjuntos de recursos de Databricks existente:
Inicie Visual Studio Code. En el menú principal, haga clic en Archivo>Abrir carpeta y vaya al directorio que contiene el proyecto de agrupación.
Haga clic en el icono de Databricks en la barra lateral de Visual Studio Code para abrir y empezar a usar las características de la extensión.
Si la extensión de Databricks para Visual Studio Code detecta más de un proyecto de Conjuntos de recursos de Databricks en la carpeta actual, le permite abrir un proyecto o crear un archivo de configuración de proyecto en la carpeta raíz.
- Si eligió un proyecto, en la Paleta de comandos , seleccione el proyecto conjuntos de recursos de Databricks existente.
- Si crea una configuración en la carpeta raíz, esa carpeta se convierte en un proyecto de agrupación.
Seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de la autorización para la extensión de Databricks para Visual Studio Code.
Nota:
Si abre un proyecto creado con la extensión Databricks para Visual Studio Code v1, la migración se intentará automáticamente mediante la configuración de área de trabajo y autenticación existente del proyecto. El botón de migración solo está disponible si se produce un error en la migración automática.
Cambio entre proyectos de Databricks
La extensión de Databricks para Visual Studio Code permite tener varios proyectos de Databricks en el área de trabajo de Visual Studio Code y cambiar fácilmente entre ellos. Con el proyecto de agrupación múltiple abierto en el área de trabajo de Visual Studio Code:
En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
Haga clic en la Carpeta local para seleccionar el proyecto que va a usar la extensión.
selector de carpetas locales
Nota:
Las acciones de ejecución solo están disponibles para los archivos del lote activo.
Convertir un proyecto en un proyecto de Databricks
Si tiene un proyecto existente que desea convertir en un proyecto de Databricks:
- Inicie Visual Studio Code. En el menú principal, haga clic en Archivo>Abrir carpeta y vaya al proyecto para abrirlo.
- En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
- Haga clic en Crear configuración.
- En la Paleta de comandos, seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de la autorización para la extensión de Databricks para Visual Studio Code.