Partilhar via


Tabelas do Azure Databricks

O Azure Databricks fornece vários tipos de tabela e formatos de armazenamento para atender a diferentes necessidades de gerenciamento de dados. Esta seção aborda tabelas gerenciadas, externas e estrangeiras, juntamente com os formatos de armazenamento Delta Lake e Apache Iceberg que alimentam recursos avançados, como transações de Atomicidade, Consistência, Isolamento e Durabilidade (ACID) e viagens no tempo.

Conceitos-chave

Aprenda os fundamentos de tipos de tabela, formatos de armazenamento e integração com o Unity Catalog.

Tópico Description
Conceitos de tabelas Conceitos principais e informações básicas sobre tipos de tabela, formatos de armazenamento e integração do Catálogo Unity.

Tipos de tabela

Explore diferentes tipos de tabela e seus recursos para vários cenários de gerenciamento de dados.

Tipo de tabela Description
Tabelas gerenciadas Tabelas em que o Azure Databricks gerencia metadados e arquivos de dados. Recomendado para novas tabelas com desempenho e armazenamento otimizados.
Tabelas externas Tabelas que fazem referência a dados armazenados em sistemas de armazenamento externos enquanto gerenciam metadados no Unity Catalog.
Mesas estrangeiras Tabelas somente leitura que representam dados em sistemas externos conectados por meio da Lakehouse Federation.

Formatos de armazenamento

Trabalhe com formatos de tabela abertos que fornecem recursos avançados de gerenciamento de dados.

Formato Description
Lago Delta Formato de armazenamento padrão que fornece transações ACID, viagens no tempo e imposição de esquema para tabelas gerenciadas e externas.
Apache Iceberg Formato de tabela aberta para integração com o ecossistema Iceberg, suportando gerenciamento avançado de metadados.

Gestão de tabelas

Configure e otimize o comportamento, a estrutura e o desempenho da tabela.

Característica Description
Restrições de tabela Defina e aplique regras de qualidade de dados com restrições de verificação e não restrições nulas.
Aplicação do esquema Controle como o Azure Databricks lida com alterações de esquema e imposição de tipo de dados durante gravações.
Particionamento de tabelas Organize dados por chaves de partição para melhorar o desempenho da consulta e o gerenciamento de dados.
Monitorização do tamanho da tabela Monitore e analise o uso do armazenamento de tabelas e os padrões de crescimento.
Converter externo em gerenciado Migre tabelas externas para tabelas gerenciadas para melhorar o desempenho e o gerenciamento.
Descoberta de partição externa Descubra e registre partições automaticamente em tabelas externas armazenadas no armazenamento em nuvem.