Partilhar via


DBFS CLI (legado)

Importante

Esta documentação foi desativada e pode não ser atualizada.

Essas informações se aplicam às versões herdadas da CLI do Databricks 0.18 e inferiores. O Databricks recomenda que você use a CLI mais recente do Databricks versão 0.205 ou superior. Consulte O que é a CLI do Databricks?. Para encontrar sua versão da CLI do Databricks, execute databricks -v.

Para migrar da CLI do Databricks versão 0.18 ou inferior para a CLI do Databricks versão 0.205 ou superior, consulte Migração da CLI do Databricks.

Você executa os subcomandos da CLI do DBFS do Databricks anexando-os ( databricks fs ou o alias dbfs), prefixando todos os caminhos DBFS com dbfs:/. Esses subcomandos chamam a API DBFS.

databricks fs -h
Usage: databricks fs [OPTIONS] COMMAND [ARGS]...

  Utility to interact with DBFS. DBFS paths are all prefixed
  with dbfs:/. Local paths can be absolute or local.

Options:
  -v, --version
  -h, --help     Show this message and exit.

Commands:
  cat        Shows the contents of a file. Does not work for directories.
  configure
  cp         Copies files to and from DBFS.
    Options:
      -r, --recursive
      --overwrite     Overwrites files that exist already.
  ls         Lists files in DBFS.
    Options:
      --absolute      Displays absolute paths.
      -l              Displays full information including size and file type.
  mkdirs     Makes directories in DBFS.
  mv         Moves a file between two DBFS paths.
  rm         Removes files from DBFS.
    Options:
      -r, --recursive

Para operações que listam, movem ou excluem mais de 10 mil arquivos, desencorajamos fortemente o uso da CLI DBFS.

  • A list operação (databricks fs ls) expirará após aproximadamente 60s.
  • A move operação (databricks fs mv) expirará após aproximadamente 60s, potencialmente resultando em dados parcialmente movidos.
  • A delete operação (databricks fs rm) excluirá incrementalmente lotes de arquivos.

Recomendamos que você execute essas operações no contexto de um cluster, usando o utilitário do sistema de arquivos (dbutils.fs). dbutils.fs abrange o escopo funcional da API REST DBFS, mas a partir de blocos de anotações. A execução dessas operações usando notebooks oferece um melhor controle, como exclusões seletivas, capacidade de gerenciamento e a possibilidade de automatizar trabalhos periódicos.

Limitações

Não há suporte para o uso da CLI do Databricks DBFS com contêineres de armazenamento habilitados para firewall. O Databricks recomenda a utilização do Databricks Connect ou az storage.

Listar o conteúdo de um arquivo

Para exibir a documentação de uso, execute databricks fs cat --help.

databricks fs cat dbfs:/tmp/my-file.txt
Apache Spark is awesome!

Copiar um ficheiro

Para exibir a documentação de uso, execute databricks fs cp --help.

databricks fs cp dbfs:/tmp/your_file.txt dbfs:/parent/child/grandchild/my_file.txt --overwrite

Quando for bem-sucedido, este comando não exibe nada.

Listar informações sobre arquivos e diretórios

Para exibir a documentação de uso, execute databricks fs ls --help.

databricks fs ls dbfs:/tmp --absolute -l
file  42408084  dbfs:/tmp/LoanStats.csv    1590005159000
file        40  dbfs:/tmp/file_b.txt       1603991038000
dir          0  dbfs:/tmp/hive                         0
dir          0  dbfs:/tmp/mlflow                       0
file       385  dbfs:/tmp/multi-line.json  1597770632000
dir          0  dbfs:/tmp/new                          0
dir          0  dbfs:/tmp/parent                       0
file       243  dbfs:/tmp/test.json        1597770628000
file        40  dbfs:/tmp/test_dbfs.txt    1603989162000

Criar um diretório

Para exibir a documentação de uso, execute databricks fs mkdirs --help.

databricks fs mkdirs dbfs:/tmp/new-dir

Quando for bem-sucedido, este comando não exibe nada.

Mover um ficheiro

Para exibir a documentação de uso, execute databricks fs mv --help.

databricks fs mv dbfs:/tmp/my-file.txt dbfs:/parent/child/grandchild/my-file.txt

Quando for bem-sucedido, este comando não exibe nada.

Eliminar um ficheiro

Para exibir a documentação de uso, execute databricks fs rm --help.

databricks fs rm dbfs:/tmp/parent/child/grandchild/my-file.txt
Delete finished successfully.