DBFS CLI (舊版)
重要
此檔已淘汰,且可能未更新。
此資訊適用于舊版 Databricks CLI 0.18 版和更新版本。 Databricks 建議您改用較新的 Databricks CLI 0.205 版或更新版本。 請參閱 什麼是 Databricks CLI? 。 若要尋找 Databricks CLI 的版本,請執行 databricks -v
。
若要從 Databricks CLI 0.18 版或更新版本移轉至 Databricks CLI 0.205 版或更新版本,請參閱 Databricks CLI 移轉 。
您可以執行 Databricks DBFS CLI 子命令,將它們附加至 databricks fs
(或別名 dbfs
),前面會加上 dbfs:/
所有 DBFS 路徑。 這些子命令會呼叫 DBFS API 。
databricks fs -h
Usage: databricks fs [OPTIONS] COMMAND [ARGS]...
Utility to interact with DBFS. DBFS paths are all prefixed
with dbfs:/. Local paths can be absolute or local.
Options:
-v, --version
-h, --help Show this message and exit.
Commands:
cat Shows the contents of a file. Does not work for directories.
configure
cp Copies files to and from DBFS.
Options:
-r, --recursive
--overwrite Overwrites files that exist already.
ls Lists files in DBFS.
Options:
--absolute Displays absolute paths.
-l Displays full information including size and file type.
mkdirs Makes directories in DBFS.
mv Moves a file between two DBFS paths.
rm Removes files from DBFS.
Options:
-r, --recursive
對於列出、移動或刪除超過 10k 個檔案的作業,我們強烈建議您使用 DBFS CLI。
- 作業
list
(databricks fs ls
) 將在大約 60 多歲之後逾時。 - 作業
move
(databricks fs mv
) 會在大約 60 多歲之後逾時,可能會導致部分移動的資料。 - 作業
delete
(databricks fs rm
) 會以累加方式刪除檔案批次。
建議您使用 檔案系統公用程式 (dbutils.fs) 在叢集的內容中執行這類作業。 dbutils.fs
涵蓋 DBFS REST API 的功能範圍,但涵蓋筆記本的功能範圍。 使用筆記本執行這類作業可提供更佳的控制,例如選擇性刪除、管理性,以及自動執行定期作業的可能性。
限制
不支援使用 Databricks DBFS CLI 搭配已啟用防火牆的儲存體容器。 Databricks 建議您使用 Databricks 連線 或 az storage 。
列出檔案的內容
若要顯示使用方式檔,請執行 databricks fs cat --help
。
databricks fs cat dbfs:/tmp/my-file.txt
Apache Spark is awesome!
複製檔案
若要顯示使用方式檔,請執行 databricks fs cp --help
。
databricks fs cp dbfs:/tmp/your_file.txt dbfs:/parent/child/grandchild/my_file.txt --overwrite
成功時,此命令不會顯示任何內容。
列出檔案和目錄的相關資訊
若要顯示使用方式檔,請執行 databricks fs ls --help
。
databricks fs ls dbfs:/tmp --absolute -l
file 42408084 dbfs:/tmp/LoanStats.csv 1590005159000
file 40 dbfs:/tmp/file_b.txt 1603991038000
dir 0 dbfs:/tmp/hive 0
dir 0 dbfs:/tmp/mlflow 0
file 385 dbfs:/tmp/multi-line.json 1597770632000
dir 0 dbfs:/tmp/new 0
dir 0 dbfs:/tmp/parent 0
file 243 dbfs:/tmp/test.json 1597770628000
file 40 dbfs:/tmp/test_dbfs.txt 1603989162000
建立目錄
若要顯示使用方式檔,請執行 databricks fs mkdirs --help
。
databricks fs mkdirs dbfs:/tmp/new-dir
成功時,此命令不會顯示任何內容。
移動檔案
若要顯示使用方式檔,請執行 databricks fs mv --help
。
databricks fs mv dbfs:/tmp/my-file.txt dbfs:/parent/child/grandchild/my-file.txt
成功時,此命令不會顯示任何內容。
刪除檔案
若要顯示使用方式檔,請執行 databricks fs rm --help
。
databricks fs rm dbfs:/tmp/parent/child/grandchild/my-file.txt
Delete finished successfully.