Partilhar via


Armazenamento padrão no Databricks

Esta página explica como funciona o armazenamento por defeito no Azure Databricks e como criar catálogos e objetos de dados que o utilizam.

O que é armazenamento padrão?

O armazenamento padrão é uma plataforma de armazenamento de objetos totalmente gerida que fornece armazenamento pronto a usar na sua conta Azure Databricks. Algumas funcionalidades do Azure Databricks usam armazenamento predefinido como alternativa ao armazenamento externo.

Os espaços de trabalho serverless usam armazenamento padrão para armazenamento interno e do espaço de trabalho, assim como para o catálogo padrão que é criado com o espaço de trabalho. Em espaços de trabalho serverless, pode criar catálogos adicionais tanto em armazenamento predefinido como no seu próprio armazenamento de objetos na nuvem.

Tanto em espaços de trabalho clássicos como em espaços de trabalho serverless, o armazenamento padrão é usado por funcionalidades para armazenar coisas como metadados do plano de controlo, dados derivados, modelos e outros artefactos. Por exemplo, Salas Limpas, Classificação de Dados, Deteção de Anomalias e Agentes Bricks utilizam todos o armazenamento padrão de um espaço de trabalho. Consulte a documentação de funcionalidades individuais para detalhes sobre o que cada funcionalidade armazena no armazenamento padrão.

Requerimentos

Criar um novo catálogo

Conclua as seguintes etapas para criar um novo catálogo usando o armazenamento padrão:

  1. Clique no ícone Dados.Catálogo na barra lateral. O Catalog Explorer é exibido.
  2. Clique em Criar o catálogo. A caixa de diálogo Criar um novo catálogo é exibida.
  3. Forneça um nome de catálogo exclusivo na sua conta.
  4. Selecione a opção Usar armazenamento padrão.
  5. Clique em Criar.

Em espaços de trabalho sem servidor, você também pode usar o seguinte comando SQL para criar um novo catálogo em seu armazenamento padrão. Não é necessário especificar um local para o catálogo.

CREATE CATALOG [ IF NOT EXISTS ] catalog_name
    [ COMMENT comment ]

Trabalhar com armazenamento padrão

Todas as interações com o armazenamento padrão exigem computação sem servidor, habilitada para Unity Catalog.

Os recursos apoiados pelo armazenamento padrão usam o mesmo modelo de privilégio que outros objetos no Unity Catalog. Você deve ter privilégios suficientes para criar, exibir, consultar ou modificar objetos de dados. Consulte privilégios do Catálogo Unity e objetos securitizáveis.

Você trabalha com armazenamento padrão criando e interagindo com tabelas gerenciadas e volumes gerenciados apoiados pelo armazenamento padrão. Consulte Tabelas gerenciadas do Catálogo Unity no Azure Databricks para Delta Lake e Apache Iceberg e O que são volumes do Catálogo Unity?.

Você pode usar o Gerenciador de Catálogos, blocos de anotações, o editor SQL e painéis para interagir com objetos de dados armazenados no armazenamento padrão.

Exemplos de tarefas

A seguir estão exemplos de tarefas que você pode concluir com o armazenamento padrão:

Limitações

Aplicam-se as seguintes limitações:

  • A computação clássica (qualquer computação que não seja sem servidor) não pode interagir com ativos de dados no armazenamento padrão.
  • O Compartilhamento Delta oferece suporte ao compartilhamento de tabelas para qualquer destinatário — aberto ou Azure Databricks — e os destinatários podem usar a computação clássica para acessar tabelas compartilhadas (Beta). Habilite o recurso Compartilhamento Delta para Armazenamento Padrão – Acesso Expandido no console da sua conta.
    • Este recurso não é suportado nas seguintes regiões: southcentralus, uksouthe westus2.
    • Todos os outros ativos compartilháveis só podem ser compartilhados Delta com destinatários do Azure Databricks na mesma nuvem. Os destinatários devem usar computação sem servidor.
  • As tabelas com particionamento ativado não podem ser compartilhadas com Delta.
  • Clientes externos Iceberg e Delta não conseguem aceder diretamente aos metadados subjacentes, lista de manifestos e ficheiros de dados para tabelas UC no armazenamento padrão (o acesso FileIO não é suportado). No entanto, ferramentas de BI como o Power BI e o Tableau podem aceder a tabelas de catálogo Unity em armazenamento predefinido usando drivers ODBC e JDBC. Os clientes externos também podem aceder a volumes do Unity Catalog em armazenamento predefinido usando a API de Ficheiros.
  • O armazenamento padrão suporta acesso externo via drivers ODBC do Azure Databricks e JDBC, incluindo a otimização de desempenho Cloud Fetch do driver ODBC para consultas em conjuntos de dados maiores. No entanto, se estiver a aceder a uma tabela de armazenamento padrão a partir de um espaço de trabalho que tenha a Ligação Privada front-end ativada, as consultas do cliente ODBC com mais de 100 MB irão falhar porque a otimização Cloud Fetch para tabelas de armazenamento padrão não suporta atualmente a Ligação Privada front-end.