Condividi tramite


sync gruppo di comandi

Nota

Queste informazioni si applicano all'interfaccia della riga di comando di Databricks versione 0.205 e successive. L'interfaccia della riga di comando di Databricks è disponibile in anteprima pubblica.

L'uso dell'interfaccia della riga di comando di Databricks è soggetto all'Informativa sulla privacy di Databricks e databricks, incluse eventuali disposizioni sui dati di utilizzo.

Il sync gruppo di comandi all'interno dell'interfaccia della riga di comando di Databricks consente la sincronizzazione unidirezionale delle modifiche dei file all'interno di una directory del file system locale, in una directory all'interno di un'area di lavoro remota di Azure Databricks.

Nota

  • I comandi sync non possono sincronizzare le modifiche dei file da una directory all'interno di un'area di lavoro remota di Azure Databricks, in una directory all'interno di un sottosistema locale.
  • sync I comandi possono sincronizzare le modifiche dei file da un computer di sviluppo locale solo ai file utente dell'area di lavoro (/Users) nell'area di lavoro di Azure Databricks. Non può eseguire la sincronizzazione con i file DBFS (dbfs:/). Per sincronizzare le modifiche dei file da un computer di sviluppo locale a DBFS (dbfs:/) nell'area di lavoro di Azure Databricks, usare l'utilità di sincronizzazione dbx.

I comandi sync vengono eseguiti aggiungendoli a databricks sync. Per visualizzare il supporto per il comando sync, esegui databricks sync -h.

Sincronizzare in modo incrementale le modifiche dei file locali in una directory remota

Per eseguire una singola sincronizzazione incrementale e unidirezionale delle modifiche dei file all'interno di una directory del file system locale, in una directory all'interno di un'area di lavoro remota di Azure Databricks, eseguire il sync comando, come indicato di seguito:

databricks sync <local-directory-path> <remote-directory-path>

Ad esempio, per eseguire una sincronizzazione unidirezionale e unidirezionale di tutte le modifiche ai file nella cartella denominata my-folder all'interno della directory di lavoro corrente locale, su un percorso specifico all'interno dell'area di lavoro remota, eseguire il comando seguente:

databricks sync ./my-folder/ /Users/someone@example.com/

In questo esempio, solo le modifiche apportate ai file dall'ultima esecuzione del sync comando vengono sincronizzate con /Users/someone@example.com/. Per impostazione predefinita, l'URL dell'area di lavoro all'interno del profilo del DEFAULT chiamante viene usato per determinare l'area di lavoro remota in cui eseguire la sincronizzazione.

Sincronizzazione completa delle modifiche dei file locali in una directory remota

Per eseguire una singola sincronizzazione completa e unidirezionale delle modifiche dei file all'interno di una directory del file system locale in una directory all'interno di un'area di lavoro remota di Azure Databricks, indipendentemente dal momento in cui è stato eseguito l'ultimo sync comando, usare l'opzione --full , ad esempio:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronizzare continuamente le modifiche dei file locali in una directory remota

Per attivare la sincronizzazione continua e unidirezionale delle modifiche dei file all'interno di una directory del file system locale, in una directory all'interno di un'area di lavoro remota di Azure Databricks, usare l'opzione --watch , ad esempio:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

La sincronizzazione unidirezionale continua fino a quando il comando non viene arrestato dal terminale, in genere premendo Ctrl + c o Ctrl + z.

Il polling per i possibili eventi di sincronizzazione avviene una volta al secondo per impostazione predefinita. Per modificare questo intervallo, usare l'opzione --interval insieme al numero di secondi di polling seguito dal carattere s, ad esempio per cinque secondi:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Modificare il formato di output dello stato di sincronizzazione

Per impostazione predefinita, le informazioni sullo stato di avanzamento della sincronizzazione vengono restituite al terminale in formato testo. Per specificare il formato di output dello stato di avanzamento della sincronizzazione, usare l'opzione --output , specificando text (impostazione predefinita, se --output non diversamente specificato) o json, ad esempio:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json