sync
gruppo di comandi
Nota
Queste informazioni si applicano all'interfaccia della riga di comando di Databricks versione 0.205 e successive. L'interfaccia della riga di comando di Databricks è disponibile in anteprima pubblica.
L'uso dell'interfaccia della riga di comando di Databricks è soggetto all'Informativa sulla privacy di Databricks e databricks, incluse eventuali disposizioni sui dati di utilizzo.
Il sync
gruppo di comandi all'interno dell'interfaccia della riga di comando di Databricks consente la sincronizzazione unidirezionale delle modifiche dei file all'interno di una directory del file system locale, in una directory all'interno di un'area di lavoro remota di Azure Databricks.
Nota
- I comandi
sync
non possono sincronizzare le modifiche dei file da una directory all'interno di un'area di lavoro remota di Azure Databricks, in una directory all'interno di un sottosistema locale. sync
I comandi possono sincronizzare le modifiche dei file da un computer di sviluppo locale solo ai file utente dell'area di lavoro (/Users
) nell'area di lavoro di Azure Databricks. Non può eseguire la sincronizzazione con i file DBFS (dbfs:/
). Per sincronizzare le modifiche dei file da un computer di sviluppo locale a DBFS (dbfs:/
) nell'area di lavoro di Azure Databricks, usare l'utilità di sincronizzazione dbx.
I comandi sync
vengono eseguiti aggiungendoli a databricks sync
. Per visualizzare il supporto per il comando sync
, esegui databricks sync -h
.
Sincronizzare in modo incrementale le modifiche dei file locali in una directory remota
Per eseguire una singola sincronizzazione incrementale e unidirezionale delle modifiche dei file all'interno di una directory del file system locale, in una directory all'interno di un'area di lavoro remota di Azure Databricks, eseguire il sync
comando, come indicato di seguito:
databricks sync <local-directory-path> <remote-directory-path>
Ad esempio, per eseguire una sincronizzazione unidirezionale e unidirezionale di tutte le modifiche ai file nella cartella denominata my-folder
all'interno della directory di lavoro corrente locale, su un percorso specifico all'interno dell'area di lavoro remota, eseguire il comando seguente:
databricks sync ./my-folder/ /Users/someone@example.com/
In questo esempio, solo le modifiche apportate ai file dall'ultima esecuzione del sync
comando vengono sincronizzate con /Users/someone@example.com/
. Per impostazione predefinita, l'URL dell'area di lavoro all'interno del profilo del DEFAULT
chiamante viene usato per determinare l'area di lavoro remota in cui eseguire la sincronizzazione.
Sincronizzazione completa delle modifiche dei file locali in una directory remota
Per eseguire una singola sincronizzazione completa e unidirezionale delle modifiche dei file all'interno di una directory del file system locale in una directory all'interno di un'area di lavoro remota di Azure Databricks, indipendentemente dal momento in cui è stato eseguito l'ultimo sync
comando, usare l'opzione --full
, ad esempio:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Sincronizzare continuamente le modifiche dei file locali in una directory remota
Per attivare la sincronizzazione continua e unidirezionale delle modifiche dei file all'interno di una directory del file system locale, in una directory all'interno di un'area di lavoro remota di Azure Databricks, usare l'opzione --watch
, ad esempio:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
La sincronizzazione unidirezionale continua fino a quando il comando non viene arrestato dal terminale, in genere premendo Ctrl + c
o Ctrl + z
.
Il polling per i possibili eventi di sincronizzazione avviene una volta al secondo per impostazione predefinita. Per modificare questo intervallo, usare l'opzione --interval
insieme al numero di secondi di polling seguito dal carattere s
, ad esempio per cinque secondi:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Modificare il formato di output dello stato di sincronizzazione
Per impostazione predefinita, le informazioni sullo stato di avanzamento della sincronizzazione vengono restituite al terminale in formato testo. Per specificare il formato di output dello stato di avanzamento della sincronizzazione, usare l'opzione --output
, specificando text
(impostazione predefinita, se --output
non diversamente specificato) o json
, ad esempio:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json