Compartilhar via


Tabelas do Azure Databricks

O Azure Databricks fornece vários tipos de tabela e formatos de armazenamento para atender às diferentes necessidades de gerenciamento de dados. Esta seção aborda tabelas gerenciadas, externas e estrangeiras, juntamente com os formatos de armazenamento Delta Lake e Apache Iceberg que oferecem recursos avançados como transações ACID (Atomicidade, Consistência, Isolamento e Durabilidade) e viagem no tempo.

Conceitos fundamentais

Conheça os conceitos básicos de tipos de tabela, formatos de armazenamento e integração do Catálogo do Unity.

Tópico Description
Conceitos de tabelas Principais conceitos e informações fundamentais sobre tipos de tabela, formatos de armazenamento e integração do Catálogo do Unity.

Tipos de tabela

Explore diferentes tipos de tabela e seus recursos para vários cenários de gerenciamento de dados.

Tipo de tabela Description
Tabelas gerenciadas do Unity Catalog no Azure Databricks para Delta Lake e Apache Iceberg O Azure Databricks gerencia metadados e arquivos de dados. Usado para novas tabelas que exigem desempenho otimizado.
Tabelas temporárias Tabelas gerenciadas do Unity Catalog com escopo de sessão para dados intermediários. Armazenamentos SQL somente.
Trabalhar com tabelas externas Dados armazenados em sistemas externos. O Catálogo do Unity gerencia apenas metadados.
Trabalhar com tabelas estrangeiras Acesso somente leitura a dados em sistemas externos conectados por meio da Federação Lakehouse.

Formatos de armazenamento

Trabalhe com formatos de tabela abertos que fornecem recursos avançados de gerenciamento de dados.

Formato Description
Lago Delta Formato de armazenamento padrão que fornece transações ACID, viagem no tempo e imposição de esquema para tabelas gerenciadas e externas.
Apache Iceberg Abra o formato de tabela para integração com o ecossistema do Iceberg, dando suporte ao gerenciamento avançado de metadados.

Gerenciamento de tabela

Configure e otimize o comportamento, a estrutura e o desempenho da tabela.

Característica Description
Restrições de tabela Defina e imponha regras de qualidade de dados com restrições de verificação e não restrições nulas.
Imposição de esquema Controlar como o Azure Databricks lida com alterações de esquema e imposição de tipo de dados durante gravações.
Particionamento de tabela Organize dados por chaves de partição para melhorar o desempenho da consulta e o gerenciamento de dados.
Monitoramento do tamanho da tabela Monitore e analise o uso do armazenamento de tabelas e os padrões de crescimento.
Converter externo para gerenciado Migre tabelas externas para tabelas gerenciadas para melhorar o desempenho e o gerenciamento.
Descoberta de partição externa Descubra e registre automaticamente partições em tabelas externas armazenadas no armazenamento em nuvem.