Dela via


DBFS CLI (äldre)

Viktigt!

Den här dokumentationen har dragits tillbaka och kanske inte uppdateras.

Den här informationen gäller för äldre Databricks CLI-versioner 0.18 och senare. Databricks rekommenderar att du använder nyare Databricks CLI version 0.205 eller senare i stället. Se Vad är Databricks CLI?. Kör för att hitta din version av Databricks CLI databricks -v.

Information om hur du migrerar från Databricks CLI version 0.18 eller senare till Databricks CLI version 0.205 eller senare finns i Databricks CLI-migrering.

Du kör Databricks DBFS CLI-underkommandon som lägger till dem i databricks fs (eller aliaset dbfs) och prefixar alla DBFS-sökvägar med dbfs:/. Dessa underkommandon anropar DBFS-API:et.

databricks fs -h
Usage: databricks fs [OPTIONS] COMMAND [ARGS]...

  Utility to interact with DBFS. DBFS paths are all prefixed
  with dbfs:/. Local paths can be absolute or local.

Options:
  -v, --version
  -h, --help     Show this message and exit.

Commands:
  cat        Shows the contents of a file. Does not work for directories.
  configure
  cp         Copies files to and from DBFS.
    Options:
      -r, --recursive
      --overwrite     Overwrites files that exist already.
  ls         Lists files in DBFS.
    Options:
      --absolute      Displays absolute paths.
      -l              Displays full information including size and file type.
  mkdirs     Makes directories in DBFS.
  mv         Moves a file between two DBFS paths.
  rm         Removes files from DBFS.
    Options:
      -r, --recursive

För åtgärder som visar, flyttar eller tar bort fler än 10 000 filer rekommenderar vi starkt att du använder DBFS CLI.

  • Åtgärden list (databricks fs ls) överskrider tidsgränsen efter cirka 60-talet.
  • Åtgärden move (databricks fs mv) överskrider tidsgränsen efter cirka 60-talet, vilket kan resultera i delvis flyttade data.
  • Åtgärden delete (databricks fs rm) tar stegvis bort batchar med filer.

Vi rekommenderar att du utför sådana åtgärder i kontexten för ett kluster med hjälp av filsystemverktyget (dbutils.fs). dbutils.fs omfattar det funktionella omfånget för DBFS REST API, men från notebook-filer. Om du kör sådana åtgärder med notebook-filer får du bättre kontroll, till exempel selektiva borttagningar, hanterbarhet och möjlighet att automatisera periodiska jobb.

Begränsningar

Det går inte att använda Databricks DBFS CLI med brandväggsaktiverade lagringscontainrar. Databricks rekommenderar att du använder Databricks Connect eller az storage.

Visa en lista över innehållet i en fil

Om du vill visa användningsdokumentationen kör du databricks fs cat --help.

databricks fs cat dbfs:/tmp/my-file.txt
Apache Spark is awesome!

Kopiera en fil

Om du vill visa användningsdokumentationen kör du databricks fs cp --help.

databricks fs cp dbfs:/tmp/your_file.txt dbfs:/parent/child/grandchild/my_file.txt --overwrite

Vid lyckat resultat visar det här kommandot ingenting.

Visa information om filer och kataloger

Om du vill visa användningsdokumentationen kör du databricks fs ls --help.

databricks fs ls dbfs:/tmp --absolute -l
file  42408084  dbfs:/tmp/LoanStats.csv    1590005159000
file        40  dbfs:/tmp/file_b.txt       1603991038000
dir          0  dbfs:/tmp/hive                         0
dir          0  dbfs:/tmp/mlflow                       0
file       385  dbfs:/tmp/multi-line.json  1597770632000
dir          0  dbfs:/tmp/new                          0
dir          0  dbfs:/tmp/parent                       0
file       243  dbfs:/tmp/test.json        1597770628000
file        40  dbfs:/tmp/test_dbfs.txt    1603989162000

Skapa en katalog

Om du vill visa användningsdokumentationen kör du databricks fs mkdirs --help.

databricks fs mkdirs dbfs:/tmp/new-dir

Vid lyckat resultat visar det här kommandot ingenting.

Flytta en fil

Om du vill visa användningsdokumentationen kör du databricks fs mv --help.

databricks fs mv dbfs:/tmp/my-file.txt dbfs:/parent/child/grandchild/my-file.txt

Vid lyckat resultat visar det här kommandot ingenting.

Ta bort en fil

Om du vill visa användningsdokumentationen kör du databricks fs rm --help.

databricks fs rm dbfs:/tmp/parent/child/grandchild/my-file.txt
Delete finished successfully.