Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Note
Queste informazioni si applicano all'interfaccia della riga di comando di Databricks versione 0.205 e successive. L'interfaccia della riga di comando di Databricks è disponibile in anteprima pubblica.
L'uso della CLI di Databricks è soggetto alla Licenza di Databricks e all'Informativa sulla privacy di Databricks, incluse eventuali disposizioni sui dati di utilizzo.
Il sync gruppo di comandi all'interno dell'interfaccia della riga di comando di Databricks consente la sincronizzazione unidirezionale delle modifiche di codice locale e file in una directory nel computer di sviluppo locale in una cartella nell'area di lavoro remota di Azure Databricks.
Note
-
syncnon è in grado di sincronizzare le modifiche dei file da una cartella in un'area di lavoro di Azure Databricks remota a una directory nel computer di sviluppo locale. -
syncpuò sincronizzare le modifiche dei file da un computer di sviluppo locale solo ai file utente dell'area di lavoro (/Users) nell'area di lavoro di Azure Databricks. Non può eseguire la sincronizzazione con i file DBFS (dbfs:/). Per sincronizzare le modifiche dei file da un computer di sviluppo locale a DBFS (dbfs:/) nell'area di lavoro di Azure Databricks, usare l'utilità di sincronizzazione dbx .
sincronizzazione di databricks
Sincronizzare una directory locale con una directory dell'area di lavoro.
databricks sync [flags] SRC DST
Arguments
SRC
Percorso della directory di origine
DST
Percorso della directory di destinazione
Options
--dry-run
Simulare l'esecuzione della sincronizzazione senza apportare modifiche effettive
--exclude strings
Modelli da escludere dalla sincronizzazione (possono essere specificati più volte)
--exclude-from string
File contenente modelli da escludere dalla sincronizzazione (un modello per riga)
--full
Eseguire la sincronizzazione completa (il valore predefinito è incrementale)
--include strings
Modelli da includere nella sincronizzazione (possono essere specificati più volte)
--include-from string
File contenente i modelli da includere per la sincronizzazione (un modello per riga)
--interval duration
Intervallo di polling del file system (per --watch) (impostazione predefinita 1s)
--watch
Controllare le modifiche apportate al file system locale
Examples
Le sezioni seguenti illustrano come usare il sync comando .
Sincronizzare in modo incrementale le modifiche dei file locali in una directory remota
Per eseguire una singola sincronizzazione incrementale e unidirezionale delle modifiche dei file all'interno di una directory locale in una cartella in un'area di lavoro remota di Azure Databricks, eseguire il sync comando, come indicato di seguito:
databricks sync <local-directory-path> <remote-directory-path>
Ad esempio, per eseguire una sincronizzazione unidirezionale, unica e incrementale di tutte le modifiche ai file nella cartella denominata my-local-folder nella directory di lavoro corrente locale, verso la cartella my-workspace-folder nell'area di lavoro remota, eseguire il comando seguente:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder
In questo esempio, solo le modifiche apportate ai file dall'ultima esecuzione del sync comando vengono sincronizzate con /Users/someone@example.com/my-workspace-folder. Per impostazione predefinita, l'URL dell'area di lavoro all'interno del profilo del DEFAULT chiamante viene usato per determinare l'area di lavoro remota in cui eseguire la sincronizzazione.
Sincronizza solo file specifici
Per includere o escludere file specifici da sincronizzare in base ai modelli specificati, usare le --includeopzioni , --include-from--exclude, o --exclude-from .
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
Note
Se si desidera sincronizzare i file in un pacchetto, usare invece la configurazione sync di mapping. Consultare sync.
Nell'esempio seguente vengono esclusi determinati modelli di file dalla sincronizzazione:
databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder
Sincronizzazione completa delle modifiche dei file locali in una directory remota
Per eseguire una singola sincronizzazione completa e unidirezionale delle modifiche dei file all'interno di una directory locale in una cartella in un'area di lavoro remota di Azure Databricks, indipendentemente dal momento in cui è stato eseguito l'ultimo sync comando, usare l'opzione --full , ad esempio:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full
Sincronizzare continuamente le modifiche dei file locali in una directory remota
Per attivare la sincronizzazione continua e unidirezionale delle modifiche dei file all'interno di una directory locale, in una cartella in un'area di lavoro remota di Azure Databricks, usare l'opzione --watch , ad esempio:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch
La sincronizzazione unidirezionale continua fino a quando il comando non viene arrestato dal terminale, in genere premendo Ctrl + c o Ctrl + z.
Il polling per i possibili eventi di sincronizzazione avviene una volta al secondo per impostazione predefinita. Per modificare questo intervallo, usare l'opzione --interval insieme al numero di secondi di polling seguito dal carattere s, ad esempio per cinque secondi:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s
Modificare il formato di output del progresso della sincronizzazione
Per impostazione predefinita, le informazioni sullo stato di avanzamento della sincronizzazione vengono restituite al terminale in formato testo. Per specificare il formato di output dello stato di avanzamento della sincronizzazione, usare l'opzione --output, specificando text (impostazione predefinita, se --output non è specificato diversamente) o json, ad esempio:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json
Visualizzare in anteprima le operazioni dei file per una sincronizzazione
Per visualizzare in anteprima una sincronizzazione senza eseguire effettivamente le operazioni di sincronizzazione file, usare l'opzione --dry-run , ad esempio:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete
Bandiere globali
--debug
Indica se abilitare la registrazione di debug.
-h oppure --help
Mostra la guida per il Databricks CLI, il gruppo di comandi correlato o il comando correlato.
--log-file stringa
Stringa che rappresenta il file in cui scrivere i log di output. Se questo flag non viene specificato, l'impostazione predefinita prevede la scrittura dei log di output su stderr.
--log-format formato
Tipo di formato del log, text o json. Il valore predefinito è text.
--log-level stringa
Stringa che rappresenta il livello di formato del log. Se non specificato, il livello di formato del log è disabilitato.
tipo
Tipo di output del comando, text o json. Il valore predefinito è text.
-p, --profile stringa
Nome del profilo nel ~/.databrickscfg file da usare per eseguire il comando . Se questo flag non viene specificato, se esiste, viene usato il profilo denominato DEFAULT .
--progress-format formato
Formato per visualizzare i log di stato: default, append, inplaceo json
-t, --target stringa
Se applicabile, la destinazione del bundle da utilizzare