Share via


CLUSTER BY cláusula (TABELA)

Aplica-se a:Marque Sim Databricks SQL Marque Sim Databricks Runtime 13.3 LTS e acima Marque Sim Delta Lake apenas

Define o agrupamento líquido e multidimensional para uma tabela Delta Lake.

Pode utilizar esta cláusula quando:

  • Criar uma tabela usando CREATE TABLE
  • Altere uma tabela com ALTER TABLE para alterar as colunas de clustering. Para agrupar linhas com colunas de clustering alteradas, você deve executar OTIMIZE. Observe que as linhas agrupadas por colunas de agrupamento anteriores não são afetadas.

As linhas atualizadas não são automaticamente reagrupadas. Execute OTIMIZE para reagrupar linhas atualizadas..

Para obter mais informações sobre clustering líquido, consulte Usar clustering líquido para tabelas Delta

Sintaxe

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

Parâmetros

  • column_name

    Especifica colunas da tabela pelas quais agrupar os dados. A ordem das colunas não importa. Para se beneficiar da alteração do clustering, você deve executar OTIMIZE.

  • NENHUM

    Desativa o agrupamento para a tabela que está sendo alterada. Os dados recém-inseridos ou atualizados não serão agrupados pelo OTIMIZE. Para não usar clustering ao criar uma tabela, omita a CLUSTER BY cláusula.

Exemplos

Você pode encontrar mais exemplos em Usar agrupamento líquido para tabelas Delta.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) USING delta CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;