Compartilhar via


Tabelas do Azure Databricks

O Azure Databricks fornece vários tipos de tabela e formatos de armazenamento para atender às diferentes necessidades de gerenciamento de dados. Esta seção aborda tabelas gerenciadas, externas e estrangeiras, juntamente com os formatos de armazenamento Delta Lake e Apache Iceberg que oferecem recursos avançados como transações ACID (Atomicidade, Consistência, Isolamento e Durabilidade) e viagem no tempo.

Conceitos fundamentais

Conheça os conceitos básicos de tipos de tabela, formatos de armazenamento e integração do Catálogo do Unity.

Tópico Description
Conceitos de tabelas Principais conceitos e informações fundamentais sobre tipos de tabela, formatos de armazenamento e integração do Catálogo do Unity.

Tipos de tabela

Explore diferentes tipos de tabela e seus recursos para vários cenários de gerenciamento de dados.

Tipo de tabela Description
Tabelas gerenciadas Tabelas em que o Azure Databricks gerencia os metadados e os arquivos de dados. Recomendado para novas tabelas com desempenho e armazenamento otimizados.
tabelas externas Tabelas que fazem referência a dados armazenados em sistemas de armazenamento externos ao gerenciar metadados no Catálogo do Unity.
Tabelas estrangeiras Tabelas somente leitura que representam dados em sistemas externos conectados através da Lakehouse Federation.

Formatos de armazenamento

Trabalhe com formatos de tabela abertos que fornecem recursos avançados de gerenciamento de dados.

Formato Description
Lago Delta Formato de armazenamento padrão que fornece transações ACID, viagem no tempo e imposição de esquema para tabelas gerenciadas e externas.
Apache Iceberg Abra o formato de tabela para integração com o ecossistema do Iceberg, dando suporte ao gerenciamento avançado de metadados.

Gerenciamento de tabela

Configure e otimize o comportamento, a estrutura e o desempenho da tabela.

Característica Description
Restrições de tabela Defina e imponha regras de qualidade de dados com restrições de verificação e não restrições nulas.
Imposição de esquema Controlar como o Azure Databricks lida com alterações de esquema e imposição de tipo de dados durante gravações.
Particionamento de tabela Organize dados por chaves de partição para melhorar o desempenho da consulta e o gerenciamento de dados.
Monitoramento do tamanho da tabela Monitore e analise o uso do armazenamento de tabelas e os padrões de crescimento.
Converter externo para gerenciado Migre tabelas externas para tabelas gerenciadas para melhorar o desempenho e o gerenciamento.
Descoberta de partição externa Descubra e registre automaticamente partições em tabelas externas armazenadas no armazenamento em nuvem.