grupo de comandos fs
Observação
Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.
O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.
O grupo de comandos fs
na CLI do Databricks permite automatizar volumes no Catálogo do Unity e automatizar objetos do DBFS (Sistema de Arquivos do Databricks).
Você executa comandos fs
anexando-os a databricks fs
. Para exibir a ajuda para o comando fs
, execute databricks fs -h
.
Os comandos fs
exigem que os caminhos de volume comecem com dbfs:/Volumes
e exigem que os caminhos de diretório e arquivo no DBFS comecem com dbfs:/
.
Listar o conteúdo de um diretório
Para listar o conteúdo de um diretório em um volume ou no DBFS, use o comando ls
. Especifique o caminho para o diretório. Os exemplos a seguir listam os nomes dos objetos encontrados na raiz do volume especificado ou na raiz do DBFS:
databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/
Para exibir informações completas, incluindo tipos de objeto, tamanhos, tempos de modificação desde Época em milissegundos, bem como os nomes dos objetos, use a opção --long
ou -l
. Os exemplos a seguir listam as informações completas dos objetos encontrados na raiz do volume especificado ou em um diretório tmp
dentro da raiz DBFS:
databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l
Para exibir os caminhos de objeto completos, use a opção --absolute
. Os exemplos a seguir listam as informações completas dos objetos e os caminhos completos dos objetos encontrados na raiz do volume especificado ou em um diretório tmp
dentro da raiz DBFS:
databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute
Gerar o conteúdo de um arquivo
Para gerar o conteúdo de um arquivo, use o comando cat
. Especifique o caminho para o arquivo no DBFS. Os exemplos a seguir geram o conteúdo do arquivo chamado babynames.csv
encontrado na raiz do volume especificado ou em um diretório tmp
dentro da raiz DBFS:
databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv
Os exemplos a seguir retornam erros, pois tentam gerar o conteúdo de um diretório em vez de um arquivo:
databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp
Criar um diretório
Para criar um diretório, use o comando mkdir
. Especifique o caminho para o diretório a ser criado em um volume ou no DBFS. Se o diretório já existir, nada acontecerá. Os exemplos a seguir criam um diretório chamado squirrel-data
na raiz do volume especificado ou em um diretório chamado tmp
dentro da raiz DBFS:
databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data
Copiar um diretório ou um arquivo
Para copiar um diretório ou um arquivo, use o comando cp
. Especifique os caminhos para o diretório ou arquivo de origem para copiar e seu destino. Você pode copiar diretórios e arquivos entre o sistema de arquivos local e o DBFS e copiar diretórios e arquivos entre caminhos DBFS. Para substituir arquivos existentes, use a opção --overwrite
. Para copiar arquivos recursivamente em um diretório, use a opção --recursive
ou -r
.
O comando cp
pressupõe file:/
, se file:/
for omitido.
Os exemplos a seguir copiam um diretório chamado squirrel-data
e seu conteúdo, de um caminho de sistema de arquivos local para um diretório squirrels
dentro da raiz do volume especificado ou da raiz DBFS.
databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r
O exemplo a seguir copia um arquivo chamado squirrels.csv
de um caminho de sistema de arquivos local para um diretório chamado squirrel-data
na raiz do volume especificado ou na raiz DBFS. Se o arquivo já existir no destino, ele será substituído.
databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite
Remover um diretório
Para remover um diretório, use o comando rm
. Especifique o caminho para o diretório existente no DBFS. Os exemplos a seguir removem um diretório chamado squirrel-data
da raiz do volume especificado ou de um diretório tmp
na raiz DBFS:
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data
Se o diretório não existir, nada acontecerá e nenhum erro será retornado.
Se o diretório existir, mas não estiver vazio, um erro será retornado. Para remover um diretório não vazio e todo o conteúdo, use a opção --recursive
ou -r
. Os exemplos a seguir removem um diretório não vazio chamado squirrel-data
da raiz do volume especificado ou de um diretório tmp
na raiz DBFS:
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r