Condividi tramite


fs gruppo di comandi

Nota

Queste informazioni si applicano all'interfaccia della riga di comando di Databricks versione 0.205 e successive. L'interfaccia della riga di comando di Databricks è disponibile in anteprima pubblica.

L'uso dell'interfaccia della riga di comando di Databricks è soggetto all'Informativa sulla privacy di Databricks e databricks, incluse eventuali disposizioni sui dati di utilizzo.

Il fs gruppo di comandi all'interno dell'interfaccia della riga di comando di Databricks consente di automatizzare i volumi nel catalogo Unity e di automatizzare gli oggetti DBFS (Databricks File System).

I comandi fs vengono eseguiti aggiungendoli a databricks fs. Per visualizzare il supporto per il comando fs, esegui databricks fs -h.

fs I comandi richiedono percorsi di volume per iniziare e dbfs:/Volumes richiedere percorsi di directory e file in DBFS per iniziare con dbfs:/.

Elencare il contenuto di una directory

Per elencare il contenuto di una directory in un volume o in DBFS, usare il ls comando . Specificare il percorso della directory. Gli esempi seguenti elencano i nomi degli oggetti trovati nella radice del volume specificato o nella radice DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

Per visualizzare informazioni complete, inclusi i tipi di oggetto, le dimensioni, i tempi di modifica rispetto a Epoch in millisecondi, nonché i nomi degli oggetti, usare l'opzione --long o -l . Gli esempi seguenti elencano le informazioni complete degli oggetti trovati nella radice del volume specificato o in una tmp directory all'interno della radice DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

Per visualizzare i percorsi completi degli oggetti, usare l'opzione --absolute . Gli esempi seguenti elencano le informazioni complete degli oggetti e i percorsi completi degli oggetti presenti nella radice del volume specificato o in una tmp directory all'interno della radice DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

Output del contenuto di un file

Per restituire il contenuto di un file, usare il cat comando . Specificare il percorso del file in DBFS. Negli esempi seguenti viene restituito il contenuto del file denominato babynames.csv trovato nella radice del volume specificato o in una tmp directory all'interno della radice DBFS:

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

Gli esempi seguenti restituiscono errori, mentre tentano di restituire il contenuto di una directory anziché un file:

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

Creare una directory

Per creare una directory, usare il mkdir comando . Specificare il percorso della directory da creare in un volume o in DBFS. Se la directory esiste già, non accade nulla. Gli esempi seguenti creano una directory denominata squirrel-data all'interno della radice del volume specificato o in una directory denominata tmp all'interno della radice DBFS:

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

Copiare una directory o un file

Per copiare una directory o un file, usare il cp comando . Specificare i percorsi della directory di origine o del file da copiare e la relativa destinazione. È possibile copiare directory e file tra il file system locale e DBFS ed è possibile copiare directory e file tra percorsi DBFS. Per sovrascrivere i file esistenti, usare l'opzione --overwrite . Per copiare in modo ricorsivo i file all'interno di una directory, usare l'opzione --recursive o -r .

Il cp comando presuppone file:/, se file:/ viene omesso.

Gli esempi seguenti copiano una directory denominata squirrel-data e il relativo contenuto da un percorso del file system locale a una squirrels directory all'interno della radice del volume specificato o della radice DBFS.

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

Nell'esempio seguente viene copiato un file denominato squirrels.csv da un percorso del file system locale a una directory denominata squirrel-data all'interno della radice del volume specificato o della radice DBFS. Se il file esiste già nella destinazione, viene sovrascritto.

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

Rimuovere una directory

Per rimuovere una directory, usare il rm comando . Specificare il percorso della directory esistente in DBFS. Gli esempi seguenti rimuovono una directory denominata squirrel-data dalla radice del volume specificato o da una tmp directory nella radice DBFS:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

Se la directory non esiste, non accade nulla e non viene restituito alcun errore.

Se la directory esiste ma non è vuota, viene restituito un errore. Per rimuovere una directory non vuota e tutto il relativo contenuto, usare l'opzione --recursive o -r . Gli esempi seguenti rimuovono una directory non vuota denominata squirrel-data dalla radice del volume specificato o da una tmp directory nella radice DBFS:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r