Compartilhar via


O que é DBFS?

O termo DBFS é usado para descrever duas partes da plataforma:

  • Raiz do DBFS
  • Montagens DBFS

O armazenamento e acesso de dados usando montagens DBFS raiz ou DBFS é um padrão preterido e não recomendado pelo Databricks.

O que é Sistema de Arquivos do Databricks?

O termo DBFS significa Sistema de Arquivos do Databricks, que descreve o sistema de arquivos distribuído usado pelo Azure Databricks para interagir com o armazenamento baseado em nuvem.

A tecnologia subjacente associada ao DBFS ainda faz parte da plataforma do Azure Databricks. Por exemplo, dbfs:/ é um esquema opcional ao interagir com volumes do Catálogo do Unity.

Avisos e advertências passados e atuais sobre DBFS se aplicam apenas à raiz DBFS ou às montagens DBFS.

Como o DBFS funciona com o Catálogo do Unity?

O Databricks recomenda o uso do Catálogo do Unity para gerenciar o acesso a todos os dados.

O Catálogo do Unity adiciona os conceitos de locais externos, credenciais de armazenamento e volumes para ajudar as organizações a fornecer acesso de privilégios mínimos aos dados no armazenamento de objetos de nuvem.

Algumas configurações de segurança fornecem acesso direto aos recursos gerenciados pelo Catálogo do Unity e ao DBFS, principalmente para organizações que são migrações concluídas ou migraram parcialmente para o Catálogo do Unity. Consulte Melhores práticas para o DBFS e o Catálogo do Unity.

O que é a raiz DBFS?

A raiz DBFS é um local de armazenamento provisionado como parte da criação do workspace na conta de nuvem que contém o workspace do Azure Databricks. Para obter detalhes sobre a configuração raiz e a implantação do DBFS, consulte o início rápido do Azure Databricks.

O Databricks não recomenda armazenar dados de produção, bibliotecas ou scipts na raiz do DBFS. Confira Recomendações para trabalhar com a raiz do DBFS.

Para configurar chaves gerenciadas pelo cliente para a conta de armazenamento que inclui a raiz do DBFS, consulte as Chaves gerenciadas pelo cliente para a raiz do DBFS.

Para limitar o acesso à rede à conta de armazenamento que inclui a raiz do DBFS, consulte Habilitar o suporte de firewall para sua conta de armazenamento do workspace.

Montar o armazenamento de objeto

Observação

As montagens DBFS foram preteridas. O Databricks recomenda o uso de volumes do Catálogo do Unity. Confira Criar e trabalhar com volumes.

A montagem do armazenamento de objetos no DBFS permite que você acesse objetos no armazenamento de objetos como se estivessem no sistema de arquivos local. As montagens armazenam as configurações do Hadoop necessárias para acessar o armazenamento. Para obter mais informações, confira Montagem do armazenamento de objetos de nuvem no Azure Databricks.