Compartir a través de


Grupo de comandos fs

Note

Esta información se aplica a las versiones 0.205 y posteriores de la CLI de Databricks. La CLI de Databricks está en versión preliminar pública.

El uso de la CLI de Databricks está sujeto a la licencia de Databricks y al aviso de privacidad de Databricks, incluidas las disposiciones de datos de uso.

El fs grupo de comandos de la CLI de Databricks permite realizar operaciones en el sistema de archivos en volúmenes de Unity Catalog y en el Databricks File System (DBFS).

Los comandos fs requieren que las rutas de volúmenes comiencen por dbfs:/Volumes y que las rutas de directorios y archivos en DBFS comiencen por dbfs:/.

Para realizar operaciones en los archivos del área de trabajo en el directorio /Workspace, use los comandos databricks workspace. Consulte el grupo de comandosworkspace.

Important

No se admite el uso de la CLI de Databricks ni las API REST con contenedores de almacenamiento habilitados para firewall. Databricks recomienda usar Databricks Connect o az storage.

databricks fs cat

Genera el contenido de un archivo. Especifique la ruta de acceso al archivo en DBFS.

databricks fs cat FILE_PATH [flags]

Arguments

FILE_PATH

    Archivo que se va a generar

Options

Marcas globales

Examples

En los ejemplos siguientes se genera el contenido del archivo denominado babynames.csv que se encuentra en la raíz del volumen especificado o en un tmp directorio dentro de la raíz de DBFS:

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

En los ejemplos siguientes se devuelven errores, ya que se intenta generar el contenido de un directorio en lugar de un archivo:

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

databricks fs cp

Copie un directorio o un archivo. Especifique las rutas de acceso al directorio o archivo de origen que se va a copiar y su destino. Puede copiar directorios y archivos entre el sistema de archivos local y DBFS, y puede copiar directorios y archivos entre rutas de acceso de DBFS.

El comando cp supone file:/, si se omite file:/.

databricks fs cp SOURCE_PATH TARGET_PATH [flags]

Arguments

SOURCE_PATH

    El directorio de origen o la ruta de acceso del archivo

TARGET_PATH

    El directorio de destino o la ruta de acceso del archivo

Options

--overwrite

    Sobrescribir los archivos existentes

-r, --recursive

    Copiar archivos de forma recursiva dentro de un directorio

Marcas globales

Examples

En los ejemplos siguientes se copia un directorio denominado squirrel-data y su contenido, desde una ruta de acceso del sistema de archivos local a un squirrels directorio dentro de la raíz del volumen especificado o la raíz de DBFS.

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

En el ejemplo siguiente se copia un archivo denominado squirrels.csv desde una ruta de acceso del sistema de archivos local a un directorio denominado squirrel-data dentro de la raíz del volumen especificado o la raíz de DBFS. Si el archivo ya existe en el destino, se sobrescribe.

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

databricks fs ls

Enumere el contenido de un directorio especificado en un volumen o en DBFS.

databricks fs ls DIR_PATH [flags]

Arguments

DIR_PATH

    Ruta de acceso al directorio

Options

--absolute

    Mostrar rutas de acceso absolutas.

--long, -l

    Muestra información completa, incluyendo el tamaño, el tipo de archivo y el momento de modificación desde el epoch en milisegundos.

Marcas globales

Examples

En los ejemplos siguientes se enumeran los nombres de los objetos encontrados en la raíz del volumen especificado o en la raíz de DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

En los ejemplos siguientes se muestra la información completa (larga) de los objetos encontrados en la raíz del volumen especificado o en un tmp directorio dentro de la raíz de DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

En los ejemplos siguientes se muestra la información completa de los objetos y las rutas de acceso completas de los objetos, que se encuentran en la raíz del volumen especificado o en un tmp directorio dentro de la raíz de DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

El comando "databricks fs mkdir" se utiliza para crear un nuevo directorio en el sistema de archivos de Databricks.

Crea un directorio. Especifique la ruta de acceso al directorio que se va a crear en un volumen o en DBFS. Si el directorio ya existe, no sucede nada.

databricks fs mkdir DIR_PATH [flags]

Arguments

DIR_PATH

    La ruta del directorio que se va a crear

Options

Marcas globales

Examples

En los ejemplos siguientes se crea un directorio denominado squirrel-data dentro de la raíz del volumen especificado o en un directorio denominado tmp dentro de la raíz de DBFS:

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

databricks fs rm

Quita un directorio. Especifique la ruta de acceso al directorio existente en DBFS.

Si el directorio existe pero no está vacío, se devuelve un error. Si el directorio no existe, no ocurre nada.

databricks fs rm PATH [flags]

Arguments

PATH

    Ruta de acceso al directorio existente en DBFS

Options

-r, --recursive

    Quitar todo el contenido

Marcas globales

Examples

En los ejemplos siguientes se quita un directorio denominado squirrel-data de la raíz del volumen especificado o de un tmp directorio en la raíz de DBFS:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

En los ejemplos siguientes se quita un directorio no vacío denominado squirrel-data de la raíz del volumen especificado o de un directorio tmp de la raíz de DBFS.

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r

Marcas globales

--debug

  Indica si se va a habilitar el registro de depuración.

-h o --help

    Mostrar ayuda para la CLI de Databricks o el grupo de comandos relacionado o el comando relacionado.

--log-file cadena

    Cadena que representa el archivo en el que se van a escribir registros de salida. Si no se especifica esta marca, el valor predeterminado es escribir registros de salida en stderr.

--log-format formato

    Tipo de formato de registro: text o json. El valor predeterminado es text.

--log-level cadena

    Cadena que representa el nivel de formato de registro. Si no se especifica, el nivel de formato de registro está deshabilitado.

-o, --output tipo

    El tipo de salida del comando, ya sea text o json. El valor predeterminado es text.

-p, --profile cadena

    Nombre del perfil en el archivo ~/.databrickscfg para usarlo al ejecutar el comando. Si no se especifica esta marca, si existe, se usa el perfil denominado DEFAULT .

--progress-format formato

    Formato para mostrar los registros de progreso: default, append, inplaceo json

-t, --target cadena

    Si es aplicable, el objetivo del paquete que se va a usar