`CLUSTER BY` cláusula (TABLE)

Aplica-se a: Marque Sim Databricks SQL Databricks Runtime 13.3 LTS e acima Delta Lake apenas

Define agrupamento líquido e multidimensional para uma relação.

O Azure Databricks recomenda o uso de clustering líquido automático e otimização preditiva para todas as tabelas gerenciadas do Catálogo Unity. Esses recursos fornecem otimização inteligente do layout de dados com base em seus padrões de uso de dados.

Pode utilizar esta cláusula quando:

Crie uma tabela usando CREATE TABLE.
Altere uma tabela com ALTER TABLE para modificar as colunas de agrupamento.

Para agrupar linhas com colunas de clustering alteradas, você deve executar OPTIMIZE. Observe que as linhas agrupadas por colunas de agrupamento anteriores não são afetadas.

Não pode alterar as colunas de agrupamento de visualizações materializadas ou tabelas de streaming com ALTER TABLE.
Crie uma exibição materializada usando CREATE MATERIALIZED VIEW.
Crie uma tabela de streaming usando CREATE STREAMING TABLE.

As linhas atualizadas não são automaticamente reagrupadas. Executa OPTIMIZE para reagrupar as linhas atualizadas.

Para obter mais informações sobre agrupamento de líquidos, veja Utilizar agrupamento de líquidos para tabelas.

Sintaxe

CLUSTER BY { ( column_name [, ...] ) |
             AUTO |
             NONE }

Parâmetros

nome_da_coluna

Especifica colunas da relação pela qual agrupar os dados. A ordem das colunas não importa. Para se beneficiar da alteração do clustering, você deve executar OPTIMIZE.
AUTO

Aplica-se a: Databricks SQL Databricks Runtime 15.4 e superior

Direciona o Delta Lake para determinar automaticamente e, ao longo do tempo, adaptar-se às melhores colunas para agrupar. Para obter mais informações sobre agrupamento de líquidos, veja Utilizar agrupamento de líquidos para tabelas.
NONE

Desativa o agrupamento para a relação que está sendo alterada. Os dados recém-inseridos ou atualizados não serão agrupados por OPTIMIZE. Para não usar clustering ao criar uma relação, omita a CLUSTER BY cláusula.

Exemplos

Você pode encontrar mais exemplos em Usar clustering líquido para tabelas.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;

Comentários

Esta página foi útil?

Last updated on 2025-11-28

Partilhar via

CLUSTER BY cláusula (TABLE)

Sintaxe

Parâmetros

Exemplos

Artigos relacionados

Comentários

Recursos adicionais

`CLUSTER BY` cláusula (TABLE)