Partilhar via


Tabelas do Azure Databricks

O Azure Databricks fornece vários tipos de tabela e formatos de armazenamento para atender a diferentes necessidades de gerenciamento de dados. Esta seção aborda tabelas gerenciadas, externas e estrangeiras, juntamente com os formatos de armazenamento Delta Lake e Apache Iceberg que alimentam recursos avançados, como transações de Atomicidade, Consistência, Isolamento e Durabilidade (ACID) e viagens no tempo.

Conceitos-chave

Aprenda os fundamentos de tipos de tabela, formatos de armazenamento e integração com o Unity Catalog.

Tópico Description
Conceitos de tabelas Conceitos principais e informações básicas sobre tipos de tabela, formatos de armazenamento e integração do Catálogo Unity.

Tipos de tabela

Explore diferentes tipos de tabela e seus recursos para vários cenários de gerenciamento de dados.

Tipo de tabela Description
Tabelas gerenciadas do Unity Catalog no Azure Databricks para Delta Lake e Apache Iceberg O Azure Databricks gere metadados e ficheiros de dados. Usado para novas tabelas que exigem desempenho otimizado.
Quadros temporários Tabelas geridas no Unity Catalog com escopo de sessão para dados intermediários. Apenas armazéns SQL.
Trabalhar com tabelas externas Dados armazenados em sistemas externos. O Unity Catalog gere apenas metadados.
Trabalhar com tabelas externas Acesso apenas de leitura a dados em sistemas externos conectados através da Lakehouse Federation.

Formatos de armazenamento

Trabalhe com formatos de tabela abertos que fornecem recursos avançados de gerenciamento de dados.

Formato Description
Lago Delta Formato de armazenamento padrão que fornece transações ACID, viagens no tempo e imposição de esquema para tabelas gerenciadas e externas.
Apache Iceberg Formato de tabela aberta para integração com o ecossistema Iceberg, suportando gerenciamento avançado de metadados.

Gestão de tabelas

Configure e otimize o comportamento, a estrutura e o desempenho da tabela.

Característica Description
Restrições de tabela Defina e aplique regras de qualidade de dados com restrições de verificação e não restrições nulas.
Aplicação do esquema Controle como o Azure Databricks lida com alterações de esquema e imposição de tipo de dados durante gravações.
Particionamento de tabelas Organize dados por chaves de partição para melhorar o desempenho da consulta e o gerenciamento de dados.
Monitorização do tamanho da tabela Monitore e analise o uso do armazenamento de tabelas e os padrões de crescimento.
Converter externo em gerenciado Migre tabelas externas para tabelas gerenciadas para melhorar o desempenho e o gerenciamento.
Descoberta de partição externa Descubra e registre partições automaticamente em tabelas externas armazenadas no armazenamento em nuvem.