Grupo de comandos sync
Nota:
Esta información se aplica a las versiones 0.205 y posteriores de la CLI de Databricks, que se encuentran en Versión preliminar pública. Para encontrar su versión de la CLI de Databricks, ejecute databricks -v
.
Además, tenga en cuenta que el grupo de comandos sync
puede sincronizar los cambios de archivo desde un equipo de desarrollo local solo a archivos de usuario del área de trabajo (/Users
) en el área de trabajo de Azure Databricks. No se puede sincronizar con archivos DBFS (dbfs:/
). Para sincronizar los cambios de archivo de una máquina de desarrollo local con DBFS (dbfs:/
) en el área de trabajo de Azure Databricks, use la utilidad de sincronización dbx.
El grupo de comandos sync
dentro de la CLI de Databricks permite la sincronización unidireccional de cambios de archivos dentro de un directorio del sistema de archivos local con un directorio dentro de un área de trabajo remota de Azure Databricks.
Nota:
Los comandos sync
no pueden sincronizar los cambios de archivo desde un directorio dentro de un área de trabajo remota de Azure Databricks, dentro de un directorio dentro de un sistema de archivos local.
Ejecute los comandos sync
anexándolos a databricks sync
. A fin de mostrar la ayuda para este comando sync
, ejecute databricks sync -h
.
Importante
Antes de usarla, asegúrese de configurar la CLI de Databricks y de configurar la autenticación para la CLI de Databricks.
Sincronización incremental de los cambios de archivo local en un directorio remoto
Para realizar una sincronización única, incremental y unidireccional de cambios de archivos dentro de un directorio del sistema de archivos local, a un directorio dentro de un área de trabajo remota de Azure Databricks, ejecute el comando sync
de la siguiente manera:
databricks sync <local-directory-path> <remote-directory-path>
Por ejemplo, para realizar una sincronización incremental unidireccional y única de todos los cambios de archivo en la carpeta denominada my-folder
dentro del directorio de trabajo actual local, a una ruta de acceso específica dentro del área de trabajo remota, ejecute el siguiente comando:
databricks sync ./my-folder/ /Users/someone@example.com/
En este ejemplo, solo los cambios de archivo desde la última ejecución del comando sync
se sincronizan con /Users/someone@example.com/
. De forma predeterminada, la dirección URL del área de trabajo dentro del perfil DEFAULT
del autor de llamada se usa para determinar el área de trabajo remota con la que se va a sincronizar.
Sincronización completa de los cambios de archivo local en un directorio remoto
Para realizar una sincronización única, completa y unidireccional de los cambios de archivos dentro de un directorio del sistema de archivos local en un directorio dentro de un área de trabajo remota de Azure Databricks, independientemente de cuándo se ejecutó el último comando sync
, use la opción --full
, por ejemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Sincronizar continuamente los cambios de archivo local en un directorio remoto
Para activar la sincronización continua y unidireccional de los cambios de archivos dentro de un directorio del sistema de archivos local con un directorio dentro de un área de trabajo remota de Azure Databricks, use la opción --watch
, por ejemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
La sincronización unidireccional continúa hasta que el comando se detiene desde el terminal, normalmente presionando Ctrl + c
o Ctrl + z
.
El sondeo de posibles eventos de sincronización se produce una vez por segundo de forma predeterminada. Para cambiar este intervalo, use la opción --interval
junto con el número de segundos que se van a sondear seguidos del carácter s
, por ejemplo, durante cinco segundos:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Cambiar el formato de salida del progreso de sincronización
La información de progreso de sincronización se envía al terminal en formato de texto de forma predeterminada. Para especificar el formato de salida de progreso de sincronización, use la opción --output
, especificando text
(el valor predeterminado, si --output
no se especifica de otro modo) o json
, por ejemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json