Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Aplica-se a:
Databricks SQL
Databricks Runtime 13.3 LTS e acima
Delta Lake apenas
Define agrupamento líquido e multidimensional para uma relação.
O Azure Databricks recomenda o uso de clustering líquido automático e otimização preditiva para todas as tabelas gerenciadas do Catálogo Unity. Esses recursos fornecem otimização inteligente do layout de dados com base em seus padrões de uso de dados.
Pode utilizar esta cláusula quando:
Crie uma tabela usando CREATE TABLE.
Altere uma tabela com ALTER TABLE para modificar as colunas de agrupamento.
Para agrupar linhas com colunas de clustering alteradas, você deve executar OPTIMIZE. Observe que as linhas agrupadas por colunas de agrupamento anteriores não são afetadas.
Não pode alterar as colunas de agrupamento de visualizações materializadas ou tabelas de streaming com
ALTER TABLE.Crie uma exibição materializada usando CREATE MATERIALIZED VIEW.
Crie uma tabela de streaming usando CREATE STREAMING TABLE.
As linhas atualizadas não são automaticamente reagrupadas. Executa OPTIMIZE para reagrupar as linhas atualizadas.
Para obter mais informações sobre agrupamento de líquidos, veja Utilizar agrupamento de líquidos para tabelas.
Sintaxe
CLUSTER BY { ( column_name [, ...] ) |
AUTO |
NONE }
Parâmetros
-
Especifica colunas da relação pela qual agrupar os dados. A ordem das colunas não importa. Para se beneficiar da alteração do clustering, você deve executar OPTIMIZE.
AUTOAplica-se a:
Databricks SQL
Databricks Runtime 15.4 e superiorDireciona o Delta Lake para determinar automaticamente e, ao longo do tempo, adaptar-se às melhores colunas para agrupar. Para obter mais informações sobre agrupamento de líquidos, veja Utilizar agrupamento de líquidos para tabelas.
NONEDesativa o agrupamento para a relação que está sendo alterada. Os dados recém-inseridos ou atualizados não serão agrupados por OPTIMIZE. Para não usar clustering ao criar uma relação, omita a
CLUSTER BYcláusula.
Exemplos
Você pode encontrar mais exemplos em Usar clustering líquido para tabelas.
-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);
-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);
-- Recluster the table
> OPTIMIZE t;
-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;