Grupo de comandos `sync`

Artículo
03/18/2024

Nota:

Esta información se aplica a las versiones 0.205 y posteriores de la CLI de Databricks, que se encuentran en Versión preliminar pública. Para encontrar su versión de la CLI de Databricks, ejecute databricks -v.

Además, tenga en cuenta que el grupo de comandos sync puede sincronizar los cambios de archivo desde un equipo de desarrollo local solo a archivos de usuario del área de trabajo (/Users) en el área de trabajo de Azure Databricks. No se puede sincronizar con archivos DBFS (dbfs:/). Para sincronizar los cambios de archivo de una máquina de desarrollo local con DBFS (dbfs:/) en el área de trabajo de Azure Databricks, use la utilidad de sincronización dbx.

El grupo de comandos sync dentro de la CLI de Databricks permite la sincronización unidireccional de cambios de archivos dentro de un directorio del sistema de archivos local con un directorio dentro de un área de trabajo remota de Azure Databricks.

Nota:

Los comandos sync no pueden sincronizar los cambios de archivo desde un directorio dentro de un área de trabajo remota de Azure Databricks, dentro de un directorio dentro de un sistema de archivos local.

Ejecute los comandos sync anexándolos a databricks sync. A fin de mostrar la ayuda para este comando sync, ejecute databricks sync -h.

Importante

Antes de usarla, asegúrese de configurar la CLI de Databricks y de configurar la autenticación para la CLI de Databricks.

Sincronización incremental de los cambios de archivo local en un directorio remoto

Para realizar una sincronización única, incremental y unidireccional de cambios de archivos dentro de un directorio del sistema de archivos local, a un directorio dentro de un área de trabajo remota de Azure Databricks, ejecute el comando sync de la siguiente manera:

databricks sync <local-directory-path> <remote-directory-path>

Por ejemplo, para realizar una sincronización incremental unidireccional y única de todos los cambios de archivo en la carpeta denominada my-folder dentro del directorio de trabajo actual local, a una ruta de acceso específica dentro del área de trabajo remota, ejecute el siguiente comando:

databricks sync ./my-folder/ /Users/someone@example.com/

En este ejemplo, solo los cambios de archivo desde la última ejecución del comando sync se sincronizan con /Users/someone@example.com/. De forma predeterminada, la dirección URL del área de trabajo dentro del perfil DEFAULT del autor de llamada se usa para determinar el área de trabajo remota con la que se va a sincronizar.

Sincronización completa de los cambios de archivo local en un directorio remoto

Para realizar una sincronización única, completa y unidireccional de los cambios de archivos dentro de un directorio del sistema de archivos local en un directorio dentro de un área de trabajo remota de Azure Databricks, independientemente de cuándo se ejecutó el último comando sync, use la opción --full, por ejemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronizar continuamente los cambios de archivo local en un directorio remoto

Para activar la sincronización continua y unidireccional de los cambios de archivos dentro de un directorio del sistema de archivos local con un directorio dentro de un área de trabajo remota de Azure Databricks, use la opción --watch, por ejemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

La sincronización unidireccional continúa hasta que el comando se detiene desde el terminal, normalmente presionando Ctrl + c o Ctrl + z.

El sondeo de posibles eventos de sincronización se produce una vez por segundo de forma predeterminada. Para cambiar este intervalo, use la opción --interval junto con el número de segundos que se van a sondear seguidos del carácter s, por ejemplo, durante cinco segundos:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Cambiar el formato de salida del progreso de sincronización

La información de progreso de sincronización se envía al terminal en formato de texto de forma predeterminada. Para especificar el formato de salida de progreso de sincronización, use la opción --output, especificando text (el valor predeterminado, si --output no se especifica de otro modo) o json, por ejemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json

Share via

Grupo de comandos `sync`

Sincronización incremental de los cambios de archivo local en un directorio remoto

Sincronización completa de los cambios de archivo local en un directorio remoto

Sincronizar continuamente los cambios de archivo local en un directorio remoto

Cambiar el formato de salida del progreso de sincronización

Recursos adicionales

Share via

Grupo de comandos sync

Sincronización incremental de los cambios de archivo local en un directorio remoto

Sincronización completa de los cambios de archivo local en un directorio remoto

Sincronizar continuamente los cambios de archivo local en un directorio remoto

Cambiar el formato de salida del progreso de sincronización

Recursos adicionales

Grupo de comandos `sync`