Grupo de comandos de `bundle`

Note

Esta información se aplica a las versiones 0.205 y posteriores de la CLI de Databricks. La CLI de Databricks está en versión preliminar pública.

El uso de la CLI de Databricks está sujeto a la licencia de Databricks y al aviso de privacidad de Databricks, incluidas las disposiciones de datos de uso.

El bundle grupo de comandos de la CLI de Databricks contiene comandos para administrar conjuntos de recursos de Databricks. Los paquetes de activos de Databricks permiten definir proyectos como código y validar, implementar y ejecutar flujos de trabajo de Azure Databricks, tales como trabajos de Azure Databricks, canalizaciones declarativas Spark de Lakeflow y pilas de MLOps. Consulte ¿Qué son los conjuntos de recursos de Databricks?.

Note

Los comandos de paquete usan la configuración de databricks.yml para la autenticación cuando se ejecutan en la carpeta del paquete. Si desea ejecutar comandos de bundle con una autenticación diferente desde dentro de la carpeta de bundle, especifique un perfil de configuración utilizando la marca --profile (o -p) y no especifique un --target.

Como alternativa, ejecute comandos que no necesiten la misma autenticación que el paquete fuera del folder de paquete.

implementación de conjuntos de databricks

Implemente una agrupación en el área de trabajo remota.

databricks bundle deploy [flags]

Destino de agrupación e identidad

Para desplegar el paquete en un destino específico, configure la opción -t o --target junto con el nombre del destino, tal como se declara en los archivos de configuración del paquete. Si no se especifica ninguna opción de comando, se usa el destino predeterminado declarado dentro de los archivos de configuración de agrupación. Por ejemplo, para un destino declarado con el nombre dev:

databricks bundle deploy -t dev

Una agrupación se puede implementar en varias áreas de trabajo, como el desarrollo, el almacenamiento provisional y las áreas de trabajo de producción. Fundamentalmente, la root_path propiedad es lo que determina la identidad única de un lote, que tiene ~/.bundle/${bundle.name}/${bundle.target}como valor predeterminado . Por lo tanto, de forma predeterminada, la identidad de un lote se compone de la identidad del implementador, el nombre del lote y el nombre de destino de la agrupación. Si estos son idénticos en diferentes agrupaciones, la implementación de estos conjuntos interferirá entre sí.

Además, una implementación de agrupación realiza un seguimiento de los recursos que crea en el área de trabajo de destino por sus identificadores como un estado que se almacena en el sistema de archivos del área de trabajo. Los nombres de recursos no se usan para correlacionar entre una implementación de agrupación y una instancia de recurso, por lo que:

Si un recurso de la configuración de agrupación no existe en el área de trabajo de destino, se crea.
Si existe un recurso en la configuración de agrupación en el área de trabajo de destino, se actualiza en el área de trabajo.
Si se quita un recurso de la configuración de agrupación, se quita del área de trabajo de destino si se ha implementado previamente.
Solo se puede olvidar la asociación de un recurso con un lote si cambia el nombre del lote, el destino del lote o el área de trabajo. Puede ejecutar bundle validate para generar un resumen que contenga estos valores.

Opciones

--auto-approve

Omita las aprobaciones interactivas que podrían ser necesarias para la implementación.

-c, --cluster-id string

Invalide el clúster en la implementación con el identificador de clúster especificado.

--fail-on-active-runs

Error si hay trabajos o canalizaciones en ejecución en la implementación.

--force

Forzar la validación de la rama de Git.

--force-lock

Forzar la adquisición del bloqueo de implementación. Esta opción deshabilita el mecanismo que impide que las implementaciones simultáneas interactúen entre sí. Solo se debe usar si la implementación anterior se bloqueó o se interrumpió y dejó un archivo de bloqueo obsoleto.

--plan

Ruta de acceso a un archivo de plan JSON que se va a aplicar en lugar de planear (solo motor directo). El archivo de plan se puede crear mediante databricks bundle plan -o json.

Marcas globales

Ejemplos

En el ejemplo siguiente se implementa una agrupación mediante un identificador de clúster específico:

databricks bundle deploy --cluster-id 0123-456789-abcdef

implementación de conjuntos de databricks

Comandos relacionados con la implementación.

databricks bundle deployment [command]

Comandos disponibles

bind - Enlace un recurso definido por agrupación a un recurso existente en el área de trabajo remota.
migrate - Migración de un paquete para usar el motor de implementación directa.
unbind : desenlace un recurso definido por agrupación de su recurso remoto.

enlace de implementación de conjuntos de databricks

Vincule los recursos definidos por la agrupación a los recursos existentes en el área de trabajo de Azure Databricks para que se administren con los conjuntos de recursos de Databricks. Si enlaza un recurso, el recurso de Azure Databricks existente en el área de trabajo se actualiza en función de la configuración definida en la agrupación a la que se enlaza después de la siguiente bundle deploy.

databricks bundle deployment bind KEY RESOURCE_ID [flags]

Bind no rehace los datos. Por ejemplo, si un pipeline con datos en un catálogo tenía bind aplicado, puede implementar a ese pipeline sin perder los datos existentes. Además, no es necesario volver a calcular la vista materializada, por ejemplo, por lo que los pipelines no tienen que volver a ejecutarse.

El comando bind debe usarse con la --target marca . Por ejemplo, vincule su implementación de producción a su pipeline de producción utilizando databricks bundle deployment bind --target prod my_pipeline 7668611149d5709ac9-2906-1229-9956-586a9zed8929

Tip

Es una buena idea confirmar el recurso en el área de trabajo antes de ejecutar bind.

Bind es compatible con los siguientes recursos:

Para los recursos admitidos por el comando bundle generate, vincule automáticamente el recurso después de su generación utilizando la opción --bind.

Argumentos

KEY

Clave del recurso que se va a enlazar

RESOURCE_ID

Identificador del recurso existente al que se va a enlazar

Opciones

--auto-approve

Aprobar automáticamente el enlace, en lugar de preguntar

--force-lock

Marcas globales

Ejemplos

El siguiente comando enlaza el recurso hello_job a su homólogo remoto en el área de trabajo. El comando genera una diferencia y permite denegar el enlace de recursos, pero si se confirma, las actualizaciones de la definición de trabajo de la agrupación se aplican al trabajo remoto correspondiente cuando se implementa la agrupación a continuación.

databricks bundle deployment bind hello_job 6565621249

Migrar la implementación del paquete de databricks

Important

Esta característica es Experimental.

Migre el paquete del uso del motor de implementación de Terraform al motor de implementación directa. Consulte Migración al motor de implementación directa. Para completar la migración, debe implementar el paquete.

Para comprobar que una migración se realizó correctamente, ejecute databricks bundle plan. Consulte el Databricks Bundle Plan.

databricks bundle deployment migrate [flags]

Argumentos

Ninguno

Opciones

Marcas globales

Ejemplos

En el ejemplo siguiente se migra la agrupación actual para usar el motor de implementación directa:

databricks bundle deployment migrate

implementación de conjuntos de databricks desenlace

Quite el vínculo entre el recurso de una agrupación y su homólogo remoto en un área de trabajo.

databricks bundle deployment unbind KEY [flags]

Argumentos

KEY

La clave del recurso para desvincular

Opciones

--force-lock

Marcas globales

Ejemplos

En el ejemplo siguiente se desenlace el hello_job recurso:

databricks bundle deployment unbind hello_job

databricks bundle destruir

Warning

Al destruir un paquete, los trabajos, las canalizaciones y los artefactos previamente implementados se eliminan de forma permanente. Esta acción no se puede deshacer.

Elimine trabajos, canalizaciones, otros recursos y artefactos que se implementaron anteriormente.

databricks bundle destroy [flags]

Note

La identidad de un lote se compone del nombre del lote, el destino del lote y el área de trabajo. Si ha cambiado cualquiera de estos y, a continuación, intenta destruir un lote antes de la implementación, se producirá un error.

De forma predeterminada, se le pedirá que confirme la eliminación permanente de los trabajos, canalizaciones y artefactos implementados anteriormente. Para omitir estas solicitudes y realizar una eliminación permanente automática, agregue la opción --auto-approve al comando bundle destroy.

Opciones

--auto-approve

Omitir aprobaciones interactivas para eliminar recursos y archivos

--force-lock

Marcas globales

Ejemplos

El comando siguiente elimina todos los recursos y artefactos implementados anteriormente que se definen en los archivos de configuración de agrupación:

databricks bundle destroy

databricks bundle generate (generación de conjuntos de databricks)

Genere la configuración de agrupación para un recurso que ya existe en el área de trabajo de Databricks. Se admiten los siguientes recursos: aplicación, panel, trabajo, canalización.

De forma predeterminada, este comando genera un *.yml archivo para el recurso en la resources carpeta del proyecto de agrupación y también descarga los archivos, como cuadernos, a los que se hace referencia en la configuración.

Important

El comando bundle generate se proporciona como una comodidad para generar automáticamente la configuración de recursos. Sin embargo, si la agrupación incluye la configuración de recursos y la implementa, Azure Databricks crea un nuevo recurso en lugar de actualizar el existente. Para actualizar un recurso existente, debe usar la opción --bind con bundle generate o ejecutar bundle deployment bind antes de desplegar. Consulte enlace de implementación de conjuntos de databricks.

databricks bundle generate [command]

Comandos disponibles

app - Generación de la configuración de agrupación para una aplicación de Databricks.
dashboard - Generar configuración para un panel.
job - Generación de la configuración de agrupación para un trabajo.
pipeline - Generación de la configuración de agrupación para una canalización.

Opciones

--key string

Clave de recurso que se va a usar para la configuración generada

Marcas globales

databricks bundle generate app (generación de una aplicación de databricks)

Genere la configuración de agrupación para una aplicación de Databricks existente en el área de trabajo.

databricks bundle generate app [flags]

Opciones

--bind

Enlace automáticamente el recurso generado con el existente en el área de trabajo.

-d, --config-dir string

Ruta de acceso del directorio donde se almacenará la configuración del paquete de salida (recursos predeterminados)

--existing-app-name string

Nombre de la aplicación para el que se va a generar la configuración

-f, --force

Forzar la sobrescritura de archivos existentes en el directorio de salida

-s, --source-dir string

Ruta de acceso del directorio donde se almacenarán los archivos de la aplicación (valor predeterminado "src/app")

Marcas globales

Ejemplos

En el ejemplo siguiente se genera la configuración de una aplicación existente denominada my-app. Puede obtener el nombre de la aplicación en la pestaña Compute>Apps de la interfaz de usuario del área de trabajo.

databricks bundle generate app --existing-app-name my-app

El comando siguiente genera un nuevo hello_world.app.yml archivo en la resources carpeta del proyecto de agrupación y descarga los archivos de código de la aplicación, como el archivo app.yaml de configuración de comandos de la aplicación y el principal app.py. De forma predeterminada, los archivos de código se copian en la carpeta del src lote.

databricks bundle generate app --existing-app-name "hello_world"

# This is the contents of the resulting /resources/hello-world.app.yml file.
resources:
  apps:
    hello_world:
      name: hello-world
      description: A basic starter application.
      source_code_path: ../src/app

generación de un panel de agrupación de databricks

Genere la configuración de un panel existente en el área de trabajo.

databricks bundle generate dashboard [flags]

Tip

Para actualizar el archivo .lvdash.json después de haber desplegado un cuadro de mando, utilice la opción --resource cuando ejecute bundle generate dashboard para generar ese archivo para el recurso de cuadro de mando existente. Para sondear y recuperar continuamente las actualizaciones de un cuadro de mando, utilice las opciones --force y --watch.

Opciones

--bind

Enlace automáticamente el recurso generado con el existente en el área de trabajo.

-s, --dashboard-dir string

Directorio para escribir la representación del panel en (valor predeterminado "src")

--existing-id string

Identificador del panel para el que se va a generar la configuración

--existing-path string

Ruta de acceso del área de trabajo del panel para la que se va a generar la configuración

-f, --force

Forzar la sobrescritura de archivos existentes en el directorio de salida

--resource string

Clave de recurso del panel para ver los cambios

-d, --resource-dir string

Directorio para escribir la configuración en (recursos predeterminados)

--watch

Observe los cambios en el panel y actualice la configuración.

Marcas globales

Ejemplos

En el ejemplo siguiente se genera la configuración mediante un identificador de panel existente:

databricks bundle generate dashboard --existing-id abc123

También puede generar la configuración de un panel existente por ruta de acceso del área de trabajo. Copie la ruta de acceso del área de trabajo de un panel desde la interfaz de usuario del área de trabajo.

Por ejemplo, el siguiente comando genera un nuevo archivo baby_gender_by_county.dashboard.yml en la carpeta del proyecto del paquete resources que contiene el YAML siguiente, y descarga el archivo baby_gender_by_county.lvdash.json en la carpeta del proyecto src.

databricks bundle generate dashboard --existing-path "/Workspace/Users/someone@example.com/baby_gender_by_county.lvdash.json"

# This is the contents of the resulting baby_gender_by_county.dashboard.yml file.
resources:
  dashboards:
    baby_gender_by_county:
      display_name: 'Baby gender by county'
      warehouse_id: aae11o8e6fe9zz79
      file_path: ../src/baby_gender_by_county.lvdash.json

databricks generar conjunto de tareas

Generar configuración de agrupación para un trabajo.

Note

Actualmente, este comando solo admite trabajos con tareas de cuaderno.

databricks bundle generate job [flags]

Opciones

--bind

Enlace automáticamente el recurso generado con el existente en el área de trabajo.

-d, --config-dir string

Ruta de acceso de Dir donde se almacenará la configuración de salida (recursos predeterminados)

--existing-job-id int

Identificador de trabajo del trabajo para el que se va a generar la configuración

-f, --force

Forzar la sobrescritura de archivos existentes en el directorio de salida

-s, --source-dir string

Ruta de acceso de Dir donde se almacenarán los archivos descargados (el valor predeterminado es "src")

Marcas globales

Ejemplos

En el ejemplo siguiente se genera un nuevo hello_job.yml archivo en la resources carpeta del proyecto de agrupación que contiene el archivo YAML siguiente y se descarga en simple_notebook.py la carpeta del src proyecto. También enlaza el recurso generado con el trabajo existente en el área de trabajo.

databricks bundle generate job --existing-job-id 6565621249 --bind

# This is the contents of the resulting hello_job.yml file.
resources:
  jobs:
    hello_job:
      name: 'Hello Job'
      tasks:
        - task_key: run_notebook
          email_notifications: {}
          notebook_task:
            notebook_path: ../src/simple_notebook.py
            source: WORKSPACE
          run_if: ALL_SUCCESS
      max_concurrent_runs: 1

databricks bundle generate pipeline (Generación de canalización de databricks)

Genere la configuración del paquete para una canalización existente.

databricks bundle generate pipeline [flags]

Tip

Si tiene un proyecto de canalizaciones declarativas (SDP) de Spark existente, puede generar la configuración para él mediante databricks pipelines generate. Consulte generación de canalizaciones de Databricks.

Opciones

--bind

Enlace automáticamente el recurso generado con el existente en el área de trabajo.

-d, --config-dir string

Ruta de acceso de Dir donde se almacenará la configuración de salida (recursos predeterminados)

--existing-pipeline-id string

Identificador de la canalización para la que se va a generar la configuración

-f, --force

Forzar la sobrescritura de archivos existentes en el directorio de salida

-s, --source-dir string

Ruta de acceso de Dir donde se almacenarán los archivos descargados (el valor predeterminado es "src")

Marcas globales

Ejemplos

En el ejemplo siguiente se genera la configuración de una canalización existente:

databricks bundle generate pipeline --existing-pipeline-id abc-123-def

databricks bundle init

Inicialice una nueva agrupación mediante una plantilla de agrupación. Las plantillas se pueden configurar para solicitar al usuario valores. Consulte Plantillas de proyecto de agrupación de recursos de Databricks.

databricks bundle init [TEMPLATE_PATH] [flags]

Argumentos

TEMPLATE_PATH

Plantilla que se va a usar para la inicialización (opcional)

Opciones

--branch string

Rama de Git que se va a usar para la inicialización de plantillas

--config-file string

Archivo JSON que contiene pares clave-valor de los parámetros de entrada necesarios para la inicialización de plantillas.

--output-dir string

Directorio en el que se va a escribir la plantilla inicializada.

--tag string

Etiqueta Git que se va a usar para la inicialización de plantillas

--template-dir string

Ruta de acceso de directorio dentro de un repositorio de Git que contiene la plantilla.

Marcas globales

Ejemplos

En el ejemplo siguiente se solicita una lista de plantillas de agrupación predeterminadas desde las que elegir:

databricks bundle init

En el ejemplo siguiente se inicializa una agrupación mediante la plantilla predeterminada de Python:

databricks bundle init default-python

Para crear una agrupación de recursos de Databricks mediante una plantilla personalizada de Conjunto de recursos de Databricks, especifique la ruta de acceso de la plantilla personalizada:

databricks bundle init <project-template-local-path-or-url> \
--project-dir="</local/path/to/project/template/output>"

En el ejemplo siguiente se inicializa una agrupación desde un repositorio de Git:

databricks bundle init https://github.com/my/repository

En el ejemplo siguiente se inicializa con una rama específica:

databricks bundle init --branch main

conjunto de databricks abierto

Vaya a un recurso de agrupación en el área de trabajo y especifique el recurso que se va a abrir. Si no se especifica una clave de recurso, este comando genera una lista de los recursos de la agrupación desde los que elegir.

databricks bundle open [flags]

Opciones

--force-pull

Omitir la caché local y cargar el estado desde el área de trabajo remota

Marcas globales

Ejemplos

En el ejemplo siguiente se inicia un explorador y se navega al baby_gender_by_county panel del lote en el área de trabajo de Databricks que está configurada para la agrupación:

databricks bundle open baby_gender_by_county

plan de paquete de Databricks

Muestra el plan de implementación para la configuración de agrupación actual.

Este comando compila la agrupación y muestra las acciones que se realizarán en los recursos que se implementarían, sin realizar ningún cambio. Esto le permite obtener una vista previa de los cambios antes de ejecutar bundle deploy.

databricks bundle plan [flags]

Opciones

-c, --cluster-id string

Invalide el clúster en la implementación con el identificador de clúster especificado.

--force

Forzar la validación de la rama de Git.

Marcas globales

Ejemplos

En el ejemplo siguiente se genera el plan de implementación de un paquete que genera una rueda de Python y se definen un trabajo y una canalización:

databricks bundle plan

Building python_artifact...
create jobs.my_bundle_job
create pipelines.my_bundle_pipeline

databricks bundle run

Ejecute un trabajo, una canalización o un script. Si no especifica un recurso, el comando le mostrará trabajos, canalizaciones y scripts definidos entre los que puede elegir. Como alternativa, especifique el trabajo, la clave de canalización o el nombre del script que se declaran en los archivos de configuración del paquete.

databricks bundle run [flags] [KEY]

Validación de una canalización

Si desea realizar una ejecución de validación de canalización, use la opción --validate-only, como se muestra en el ejemplo siguiente.

databricks bundle run --validate-only my_pipeline

Pasar parámetros de trabajo

Para pasar parámetros de trabajo, use la opción, seguida de pares clave-valor --params, donde la clave es el nombre del parámetro. Por ejemplo, el comando siguiente establece el parámetro con el nombre message en HelloWorld para el trabajo hello_job:

databricks bundle run --params message=HelloWorld hello_job

Note

Como se muestra en los ejemplos siguientes, puede pasar parámetros a tareas de trabajo mediante las opciones de tarea de trabajo, pero la --params opción es el método recomendado para pasar parámetros de trabajo. Se produce un error si se especifican parámetros de trabajo para un trabajo que no tiene parámetros de trabajo definidos o si se especifican parámetros de tarea para un trabajo que tiene parámetros de trabajo definidos.

También puede especificar argumentos de palabra clave o posicionales. Si el trabajo especificado usa parámetros de trabajo o el trabajo tiene una tarea de cuaderno con parámetros, los nombres de marca se asignan a los nombres de parámetro:

databricks bundle run hello_job -- --key1 value1 --key2 value2

O bien, si el trabajo especificado no usa parámetros de trabajo y el trabajo tiene una tarea de archivo de Python o una tarea de rueda de Python:

databricks bundle run my_job -- value1 value2 value3

Para obtener una definición de trabajo de ejemplo con parámetros, consulte Trabajo con parámetros.

Ejecuciones del script

Para ejecutar scripts como pruebas de integración con las credenciales de autenticación configuradas de un paquete, puede ejecutar scripts en línea o ejecutar un script definido en la configuración del paquete. Los scripts se ejecutan con el mismo contexto de autenticación configurado en la agrupación.

Añada un guion doble (--) después de bundle run para ejecutar scripts en línea. Por ejemplo, el siguiente comando genera el directorio de trabajo actual del usuario actual:
```
databricks bundle run -- python3 -c 'import os; print(os.getcwd())'
```
Como alternativa, defina un script dentro de la asignación scripts en la configuración de su agrupación y, a continuación, use bundle run para ejecutar el script.
```
scripts:
  my_script:
    content: python3 -c 'import os; print(os.getcwd())'
```
```
databricks bundle run my_script
```
Para obtener más información sobre la scripts configuración, consulte scripts y scripts.

La información de autenticación de paquete se transmite a los procesos secundarios mediante variables de entorno. Consulte Autenticación unificada de Databricks.

Argumentos

KEY

Identificador único del recurso que se va a ejecutar (opcional)

Opciones

--no-wait

No espere a que se complete la ejecución.

--restart

Reinicie la ejecución si ya se está ejecutando.

Marcas globales

Marcas de trabajo

Las marcas siguientes son marcas de parámetros de nivel de trabajo. Consulte Configuración de parámetros de trabajos.

--params stringToString

pares k=v separados por comas para los parámetros de trabajo (valor predeterminado [])

Marcas de tarea de trabajo

Las marcas siguientes son marcas de parámetros de nivel de tarea. Consulte Configure task parameters (Configuración de parámetros de tarea). Databricks recomienda usar parámetros de nivel de trabajo (--params) a través de parámetros de nivel de tarea.

--dbt-commands strings

Lista de comandos que se van a ejecutar para trabajos con tareas de DBT.

--jar-params strings

Lista de parámetros para trabajos con tareas JAR de Spark.

--notebook-params stringToString

Asignación de claves a valores para trabajos con tareas de cuaderno. (valor predeterminado [])

--pipeline-params stringToString

Asignación de claves a valores para trabajos con tareas de canalización. (valor predeterminado [])

--python-named-params stringToString

Asignación de claves a valores para trabajos con tareas de rueda de Python. (valor predeterminado [])

--python-params strings

Lista de parámetros para trabajos con tareas de Python.

--spark-submit-params strings

Una lista de parámetros para trabajos con Spark submit tasks ( Enviar tareas de Spark).

--sql-params stringToString

Asignación de claves a valores para trabajos con tareas SQL. (valor predeterminado [])

Marcas de canalización

Las marcas siguientes son marcas de canalización.

--full-refresh strings

Lista de tablas para restablecer y volver a calcular.

--full-refresh-all

Realice un restablecimiento completo del grafo y vuelva a calcularlo.

--refresh strings

Lista de tablas que se van a actualizar.

--refresh-all

Realice una actualización completa del grafo.

--validate-only

Realice una actualización para validar la corrección del grafo.

Ejemplos

En el ejemplo siguiente se ejecuta un trabajo hello_job en el destino predeterminado:

databricks bundle run hello_job

En el ejemplo siguiente se ejecuta un trabajo hello_job dentro del contexto de un destino declarado con el nombre dev:

databricks bundle run -t dev hello_job

En el ejemplo siguiente se cancela y reinicia una ejecución de trabajo existente:

databricks bundle run --restart hello_job

En el ejemplo siguiente se ejecuta una canalización con actualización completa:

databricks bundle run my_pipeline --full-refresh-all

En el ejemplo siguiente se ejecuta un comando en el contexto de agrupación:

databricks bundle run -- echo "hello, world"

esquema de agrupación de databricks

Mostrar el esquema JSON para la configuración de agrupación.

databricks bundle schema [flags]

Opciones

Marcas globales

Ejemplos

En el ejemplo siguiente se genera el esquema JSON para la configuración de agrupación:

databricks bundle schema

Para generar el esquema de configuración de agrupación como un archivo JSON, ejecute el bundle schema comando y redirija la salida a un archivo JSON. Por ejemplo, puede generar un archivo denominado bundle_config_schema.json dentro del directorio actual:

databricks bundle schema > bundle_config_schema.json

resumen de conjuntos de databricks

Genera un resumen de la identidad y los recursos de un paquete, incluidos los vínculos profundos de los recursos para que pueda navegar fácilmente al recurso en el área de trabajo de Databricks.

databricks bundle summary [flags]

Tip

También puede utilizar bundle open para navegar hasta un recurso en el espacio de trabajo de Databricks. Consulte el paquete de databricks abierto.

Opciones

--force-pull

Omitir la caché local y cargar el estado desde el área de trabajo remota

Marcas globales

Ejemplos

En el ejemplo siguiente se genera un resumen de los recursos implementados de un lote:

databricks bundle summary

La salida siguiente es el resumen de un paquete denominado my_pipeline_bundle que define un trabajo y una canalización:

Name: my_pipeline_bundle
Target: dev
Workspace:
  Host: https://myworkspace.cloud.databricks.com
  User: someone@example.com
  Path: /Users/someone@example.com/.bundle/my_pipeline/dev
Resources:
  Jobs:
    my_project_job:
      Name: [dev someone] my_project_job
      URL:  https://myworkspace.cloud.databricks.com/jobs/206000809187888?o=6051000018419999
  Pipelines:
    my_project_pipeline:
      Name: [dev someone] my_project_pipeline
      URL:  https://myworkspace.cloud.databricks.com/pipelines/7f559fd5-zztz-47fa-aa5c-c6bf034b4f58?o=6051000018419999

sincronización de paquetes de databricks

Realice una sincronización unidireccional de los cambios de archivo de un lote dentro de un directorio del sistema de archivos local en un directorio dentro de un área de trabajo remota de Azure Databricks.

Note

-Los comandos bundle sync no pueden sincronizar los cambios de archivo desde un directorio dentro de un área de trabajo remota de Azure Databricks, dentro de un directorio dentro de un sistema de archivos local.

databricks bundle sync [flags]

Los comandos databricks bundle sync funcionan de la misma manera que los comandos databricks sync y se proporcionan como una conveniencia de productividad. Para obtener información sobre el uso de comandos, consulte sync command.

Opciones

--dry-run

Simulación de la ejecución de sincronización sin realizar cambios reales

--full

Realizar la sincronización completa (el valor predeterminado es incremental)

--interval duration

Intervalo de sondeo del sistema de archivos (para --watch) (valor predeterminado 1s)

--output type

Tipo del formato de salida

--watch

Inspección del sistema de archivos local para ver los cambios

Marcas globales

Ejemplos

En el ejemplo siguiente se realiza una sincronización de ejecución seca:

databricks bundle sync --dry-run

En el ejemplo siguiente se comprueban los cambios y las sincronizaciones automáticamente:

databricks bundle sync --watch

En el ejemplo siguiente se realiza una sincronización completa:

databricks bundle sync --full

validación del lote de databricks

Valide que los archivos de configuración de agrupación sean sintácticamente correctos.

databricks bundle validate [flags]

De forma predeterminada, este comando devuelve un resumen de la identidad del lote:

Name: MyBundle
Target: dev
Workspace:
  Host: https://my-host.cloud.databricks.com
  User: someone@example.com
  Path: /Users/someone@example.com/.bundle/MyBundle/dev

Validation OK!

Note

El bundle validate comando genera advertencias si las propiedades de recursos se definen en los archivos de configuración de agrupación que no se encuentran en el esquema del objeto correspondiente.

Si solo desea generar un resumen de la identidad y los recursos del paquete, use resumen del paquete.

Opciones

Marcas globales

Ejemplos

En el ejemplo siguiente se valida la configuración de agrupación:

databricks bundle validate

Marcas globales

--debug

Indica si se va a habilitar el registro de depuración.

-h o --help

Mostrar ayuda para la CLI de Databricks o el grupo de comandos relacionado o el comando relacionado.

--log-file cadena

Cadena que representa el archivo en el que se van a escribir registros de salida. Si no se especifica esta marca, el valor predeterminado es escribir registros de salida en stderr.

--log-format formato

Tipo de formato de registro: text o json. El valor predeterminado es text.

--log-level cadena

Cadena que representa el nivel de formato de registro. Si no se especifica, el nivel de formato de registro está deshabilitado.

-o, --output tipo

Tipo de salida del comando, text o json. El valor predeterminado es text.

-p, --profile cadena

Nombre del perfil en el archivo ~/.databrickscfg que se usará para ejecutar el comando. Si no se especifica esta marca, si existe, se usa el perfil denominado DEFAULT .

--progress-format formato

Formato para mostrar los registros de progreso: default, append, inplaceo json

-t, --target cadena

Si procede, el destino del paquete que se va a usar

--var strings

establecer valores para las variables definidas en la configuración de agrupación. Ejemplo: --var="foo=bar"

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-02-02

Compartir a través de

Grupo de comandos de bundle

implementación de conjuntos de databricks

Destino de agrupación e identidad

Opciones

Ejemplos

implementación de conjuntos de databricks

Comandos disponibles

enlace de implementación de conjuntos de databricks

Argumentos

Opciones

Ejemplos

Migrar la implementación del paquete de databricks

Argumentos

Opciones

Ejemplos

implementación de conjuntos de databricks desenlace

Argumentos

Opciones

Ejemplos

databricks bundle destruir

Opciones

Ejemplos

databricks bundle generate (generación de conjuntos de databricks)

Comandos disponibles

Opciones

databricks bundle generate app (generación de una aplicación de databricks)

Opciones

Ejemplos

generación de un panel de agrupación de databricks

Opciones

Ejemplos

databricks generar conjunto de tareas

Opciones

Ejemplos

databricks bundle generate pipeline (Generación de canalización de databricks)

Opciones

Ejemplos

databricks bundle init

Argumentos

Opciones

Ejemplos

conjunto de databricks abierto

Opciones

Ejemplos

plan de paquete de Databricks

Opciones

Ejemplos

databricks bundle run

Validación de una canalización

Pasar parámetros de trabajo

Ejecuciones del script

Argumentos

Opciones

Marcas de trabajo

Marcas de tarea de trabajo

Marcas de canalización

Ejemplos

esquema de agrupación de databricks

Opciones

Ejemplos

resumen de conjuntos de databricks

Opciones

Ejemplos

sincronización de paquetes de databricks

Opciones

Ejemplos

validación del lote de databricks

Opciones

Ejemplos

Marcas globales

Comentarios

Recursos adicionales

Grupo de comandos de `bundle`