ИНТЕРФЕЙС командной строки DBFS (устаревшая версия)
Важно!
Поддержка этой документации прекращена, она может больше не обновляться.
Эта информация относится к устаревшим интерфейсам командной строки Databricks версии 0.18 и ниже. Databricks рекомендует использовать более новую версию Интерфейса командной строки Databricks версии 0.205 или более поздней. См. сведения о интерфейсе командной строки Databricks?. Чтобы найти версию интерфейса командной строки Databricks, выполните команду databricks -v
.
Сведения о миграции из Databricks CLI версии 0.18 или ниже в Databricks CLI версии 0.205 или более поздней, см. в статье Databricks CLI.
Вы запускаете подкомандам ИНТЕРФЕЙСА командной строки Databricks DBFS, добавляя их к databricks fs
(или псевдониму dbfs
), префиксируя все пути DBFS с помощью dbfs:/
. Эти вложенные команды вызывают API DBFS.
databricks fs -h
Usage: databricks fs [OPTIONS] COMMAND [ARGS]...
Utility to interact with DBFS. DBFS paths are all prefixed
with dbfs:/. Local paths can be absolute or local.
Options:
-v, --version
-h, --help Show this message and exit.
Commands:
cat Shows the contents of a file. Does not work for directories.
configure
cp Copies files to and from DBFS.
Options:
-r, --recursive
--overwrite Overwrites files that exist already.
ls Lists files in DBFS.
Options:
--absolute Displays absolute paths.
-l Displays full information including size and file type.
mkdirs Makes directories in DBFS.
mv Moves a file between two DBFS paths.
rm Removes files from DBFS.
Options:
-r, --recursive
Для операций, которые перечисляют, перемещают или удаляют более 10 000 файлов, настоятельно рекомендуется использовать интерфейс командной строки DBFS.
- Время ожидания операции
list
(databricks fs ls
) истекает приблизительно через 60 с. - Время ожидания операции
move
(databricks fs mv
) истечет приблизительного через 60 с, что может привести к частичному перемещению данных. - Операция
delete
(databricks fs rm
) будет выполнять постепенное удаление пакетов файлов.
Рекомендуется выполнять такие операции в контексте кластера с помощью Программы файловой системы (dbutils.fs). dbutils.fs
охватывает функциональную область REST API DBFS, но из записных книжек. Выполнение таких операций с помощью записных книжек улучшает контроль, например выборочное удаление, управляемость и возможность автоматизации периодических заданий.
Ограничения
Использование Databricks DBFS CLI с контейнерами хранилища, которые поддерживают брандмауэр, не поддерживается. Для Databricks рекомендуется использовать Databricks Connect или az storage.
Получение содержимого файла
Чтобы просмотреть документацию по использованию, выполните команду databricks fs cat --help
.
databricks fs cat dbfs:/tmp/my-file.txt
Apache Spark is awesome!
Копирование файла
Чтобы просмотреть документацию по использованию, выполните команду databricks fs cp --help
.
databricks fs cp dbfs:/tmp/your_file.txt dbfs:/parent/child/grandchild/my_file.txt --overwrite
При успешном выполнении этой команды ничего не отображается.
Вывод списка сведений о файлах и каталогах
Чтобы просмотреть документацию по использованию, выполните команду databricks fs ls --help
.
databricks fs ls dbfs:/tmp --absolute -l
file 42408084 dbfs:/tmp/LoanStats.csv 1590005159000
file 40 dbfs:/tmp/file_b.txt 1603991038000
dir 0 dbfs:/tmp/hive 0
dir 0 dbfs:/tmp/mlflow 0
file 385 dbfs:/tmp/multi-line.json 1597770632000
dir 0 dbfs:/tmp/new 0
dir 0 dbfs:/tmp/parent 0
file 243 dbfs:/tmp/test.json 1597770628000
file 40 dbfs:/tmp/test_dbfs.txt 1603989162000
Создание каталога
Чтобы просмотреть документацию по использованию, выполните команду databricks fs mkdirs --help
.
databricks fs mkdirs dbfs:/tmp/new-dir
При успешном выполнении этой команды ничего не отображается.
Перемещение файла
Чтобы просмотреть документацию по использованию, выполните команду databricks fs mv --help
.
databricks fs mv dbfs:/tmp/my-file.txt dbfs:/parent/child/grandchild/my-file.txt
При успешном выполнении этой команды ничего не отображается.
Удаление файла
Чтобы просмотреть документацию по использованию, выполните команду databricks fs rm --help
.
databricks fs rm dbfs:/tmp/parent/child/grandchild/my-file.txt
Delete finished successfully.