Compartilhar via


grupo de comandos fs

Observação

Essas informações se aplicam às versões da CLI do Databricks 0.205 e superiores, que estão em Versão Prévia Pública. Para localizar sua versão da CLI do Databricks, execute databricks -v.

O grupo de comandos fs na CLI do Databricks permite automatizar volumes no Catálogo do Unity e automatizar objetos do DBFS (Sistema de Arquivos do Databricks).

Você executa comandos fs anexando-os a databricks fs. Para exibir a ajuda para o comando fs, execute databricks fs -h.

Os comandos fs exigem que os caminhos de volume comecem com dbfs:/Volumes e exigem que os caminhos de diretório e arquivo no DBFS comecem com dbfs:/.

Importante

Para instalar a CLI do Databricks, consulte Instalar ou atualizar a CLI do Databricks. Para configurar a autenticação na CLI do Databricks, consulte Autenticação na CLI do Databricks.

Listar o conteúdo de um diretório

Para listar o conteúdo de um diretório em um volume ou no DBFS, use o comando ls. Especifique o caminho para o diretório. Os exemplos a seguir listam os nomes dos objetos encontrados na raiz do volume especificado ou na raiz do DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

Para exibir informações completas, incluindo tipos de objeto, tamanhos, tempos de modificação desde Época em milissegundos, bem como os nomes dos objetos, use a opção --long ou -l. Os exemplos a seguir listam as informações completas dos objetos encontrados na raiz do volume especificado ou em um diretório tmp dentro da raiz DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

Para exibir os caminhos de objeto completos, use a opção --absolute. Os exemplos a seguir listam as informações completas dos objetos e os caminhos completos dos objetos encontrados na raiz do volume especificado ou em um diretório tmp dentro da raiz DBFS:

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

Gerar o conteúdo de um arquivo

Para gerar o conteúdo de um arquivo, use o comando cat. Especifique o caminho para o arquivo no DBFS. Os exemplos a seguir geram o conteúdo do arquivo chamado babynames.csv encontrado na raiz do volume especificado ou em um diretório tmp dentro da raiz DBFS:

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

Os exemplos a seguir retornam erros, pois tentam gerar o conteúdo de um diretório em vez de um arquivo:

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

Criar um diretório

Para criar um diretório, use o comando mkdir. Especifique o caminho para o diretório a ser criado em um volume ou no DBFS. Se o diretório já existir, nada acontecerá. Os exemplos a seguir criam um diretório chamado squirrel-data na raiz do volume especificado ou em um diretório chamado tmp dentro da raiz DBFS:

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

Copiar um diretório ou um arquivo

Para copiar um diretório ou um arquivo, use o comando cp. Especifique os caminhos para o diretório ou arquivo de origem para copiar e seu destino. Você pode copiar diretórios e arquivos entre o sistema de arquivos local e o DBFS e copiar diretórios e arquivos entre caminhos DBFS. Para substituir arquivos existentes, use a opção --overwrite. Para copiar arquivos recursivamente em um diretório, use a opção --recursive ou -r.

O comando cp pressupõe file:/, se file:/ for omitido.

Os exemplos a seguir copiam um diretório chamado squirrel-data e seu conteúdo, de um caminho de sistema de arquivos local para um diretório squirrels dentro da raiz do volume especificado ou da raiz DBFS.

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

O exemplo a seguir copia um arquivo chamado squirrels.csv de um caminho de sistema de arquivos local para um diretório chamado squirrel-data na raiz do volume especificado ou na raiz DBFS. Se o arquivo já existir no destino, ele será substituído.

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

Remover um diretório

Para remover um diretório, use o comando rm. Especifique o caminho para o diretório existente no DBFS. Os exemplos a seguir removem um diretório chamado squirrel-data da raiz do volume especificado ou de um diretório tmp na raiz DBFS:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

Se o diretório não existir, nada acontecerá e nenhum erro será retornado.

Se o diretório existir, mas não estiver vazio, um erro será retornado. Para remover um diretório não vazio e todo o conteúdo, use a opção --recursive ou -r. Os exemplos a seguir removem um diretório não vazio chamado squirrel-data da raiz do volume especificado ou de um diretório tmp na raiz DBFS:

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r