Explorar e criar tabelas no DBFS
Importante
Esta documentação foi desativada e pode não estar atualizada. Não há mais suporte para os produtos, serviços ou tecnologias mencionados neste conteúdo. Confira Carregar arquivos no Azure Databricks, Criar ou modificar uma tabela usando o upload de arquivo e O que é o Gerenciador de Catálogos?.
Acesse o upload de arquivo DBFS herdado e a interface do usuário de criação de tabela por meio da interface do usuário para adicionar dados. Clique em Novos > Dados > DBFS.
Você também pode acessar a interface do usuário de notebooks clicando em Arquivo > Adicionar dados
O Databricks recomenda usar o Catalog Explorer para uma experiência aprimorada para exibir objetos de dados e gerenciar ACLs e a Criar ou modificar a tabela da página de carregamento de arquivos para ingerir facilmente arquivos pequenos no Delta Lake.
Observação
A disponibilidade de alguns elementos descritos neste artigo varia de acordo com as configurações do workspace. Contate o administrador do workspace ou a equipe de conta do Azure Databricks.
Importar dados
Se usarmos arquivos de dados pequenos no computador local que queiramos analisar com o Azure Databricks, podemos importá-los para o DBFS usando a interface do usuário.
Observação
Os administradores do workspace podem desabilitar esse recurso. Para saber mais, confira Gerenciar upload de dados.
Criar uma tabela
Você pode iniciar a interface do usuário da tabela de criação do DBFS clicando em Novo na barra lateral ou no botão DBFS na interface do usuário para adicionar dados. Você pode preencher uma tabela de arquivos no DBFS ou carregar arquivos.
Com a interface do usuário, só é possível criar tabelas externas.
Escolha uma fonte de dados e siga as etapas na seção correspondente para configurar a tabela.
Se um administrador de workspace do Azure Databricks desabilitou a opção Carregar Arquivo, essa opção não ficará disponível. É possível criar tabelas usando uma das outras fontes de dados.
Instruções para carregar um arquivo
- Arraste arquivos para a área de arrastar Arquivos ou clique na área de arrastar para procurar e escolher arquivos. Após o carregamento, o caminho de cada arquivo é exibido. O caminho será parecido com
/FileStore/tables/<filename>-<integer>.<file-type>
. Você pode usar esse caminho em um notebook para ler os dados. - Clique em Criar tabela com interface do usuário.
- Na lista suspensa Cluster, escolha um cluster.
Instruções para DBFS
- Selecionar um arquivo.
- Clique em Criar tabela com interface do usuário.
- Na lista suspensa Cluster, escolha um cluster.
- Arraste arquivos para a área de arrastar Arquivos ou clique na área de arrastar para procurar e escolher arquivos. Após o carregamento, o caminho de cada arquivo é exibido. O caminho será parecido com
Clique em Visualizar tabela para exibir a tabela.
No campo Nome da Tabela, substitua o nome da tabela padrão, se necessário. Nomes de tabela podem conter apenas caracteres alfanuméricos minúsculos e sublinhados e deve começar com uma letra minúscula ou um sublinhado.
No campo Criar no Banco de Dados, substitua o banco de dados
default
selecionado, se necessário.No campo Tipo de Arquivo, substitua o tipo de arquivo inferido, se necessário.
Se o tipo de arquivo é CSV:
- No campo Delimitador de Colunas, selecione se deseja substituir o delimitador inferido.
- Indique se a primeira linha deve ser usada para títulos de coluna.
- Indique se deseja inferir o esquema.
Se o tipo de arquivo é JSON, indique se o arquivo é de várias linhas.
Clique em Criar Tabela.
Exibir bancos de dados e tabelas
Observação
Os workspaces com Catalog Explorer habilitado não têm acesso ao comportamento herdado descrito abaixo.
Clique em Catálogo na barra lateral. O Azure Databricks seleciona um cluster em execução ao qual você tem acesso. A pasta Banco de Dados exibe a lista de bancos de dados com o banco de dados default
selecionado. A pasta Tabelas exibe a lista de tabelas no banco de dados default
.
Você pode alterar o cluster no menu Bancos de Dados, criar a interface do usuário da tabela ou exibir a interface do usuário da tabela. Por exemplo, no menu bancos de dados:
Clique na seta para baixo na parte superior da pasta Banco de Dados.
Selecione um cluster.
Exibir detalhes da tabela
A exibição de detalhes da tabela mostra o esquema de tabela e os dados de exemplo.
Clique em Catálogo na barra lateral.
Na pasta Bancos de Dados, clique em um banco de dados.
Na pasta Tabelas, clique no nome da tabela.
Na lista suspensa Cluster, selecione opcionalmente outro cluster para renderizar a visualização da tabela.
Observação
Para exibir a visualização da tabela, uma consulta do Spark SQL é executada no cluster selecionado na lista suspensa Cluster. Se uma carga de trabalho já está em execução no cluster, a visualização da tabela pode demorar mais para ser carregada.
Excluir tabelas com a interface do usuário
- Clique em Catálogo na barra lateral.
- Clique em ao lado do nome da tabela e selecione Excluir.