Aracılığıyla paylaş


CLUSTER BY maddesi (TABLE)

Şunlar için geçerlidir:onay işareti evet olarak işaretlenmişYalnızca Databricks SQL onay işareti evet olarak işaretlenmiş Databricks Runtime 13.3 LTS ve üzeri onay işareti evet olarak işaretlenmiş Delta Lake

Bir ilişki için sıvı, çok boyutlu kümeleme tanımlar.

Azure Databricks, Unity Kataloğu tarafından yönetilen tüm tablolar için otomatik sıvı kümelemeyi ve tahmine dayalı iyileştirmeyi kullanmanızı önerir. Bu özellikler, veri kullanım desenlerinize göre veri düzeninde akıllı iyileştirme sağlar.

Aşağıdaki durumlarda bu yan tümceyi kullanabilirsiniz:

  • CREATE TABLEkullanarak bir tablo oluşturun.
  • Kümeleme sütunlarını değiştirmek için tabloyu ALTER TABLE ile değiştirin. Değişen kümeleme sütunlarına sahip satırları kümelemek için OPTIMIZEçalıştırmanız gerekir. Önceki kümeleme sütunları tarafından kümelenmiş satırların etkilenmediğini unutmayın.
  • CREATE MATERIALIZED VIEW kullanarak malzemeleşmiş bir görünüm oluşturun.
  • CREATE STREAMING TABLEkullanarak bir akış tablosu oluşturun.

Güncelleştirilmiş satırlar otomatik olarak yeniden kümelenmez. Güncelleştirilmiş satırları yeniden kümeleyemek için OPTIMIZE çalıştırın..

Sıvı kümeleme hakkında daha fazla bilgi için bkz . Tablolar için sıvı kümeleme kullanma

Sözdizimi

CLUSTER BY { ( column_name [, ...] ) |
             AUTO |
             NONE }

Parametreler

  • sütun_adı

    Verilerin kümelenmesi için ilişki sütunlarını belirtir. Sütun sırası önemli değildir. Kümelemenin değiştirilmesinden yararlanmak için OPTIMIZEçalıştırmanız gerekir.

  • AUTO

    Şunun için geçerlidir:işaretlendi: evet Databricks SQL işaretlendi: evet Databricks Runtime 15.4 ve üzeri

    Delta Lake'i, kümelemede en iyi sütunları otomatik olarak belirlemek ve zaman içinde uyarlamak için yönlendirir. Sıvı kümeleme hakkında daha fazla bilgi için bkz. Tablolar için sıvı kümeleme kullanma.

  • NONE

    Değiştirilen ilişki için kümeleme işlevini kapatır. Yeni eklenen veya güncelleştirilen veriler OPTIMIZEtarafından kümelenmez. İlişki oluştururken kümeleme kullanmamak için CLUSTER BY yan tümcesini atlayın.

Örnekler

Daha fazla örnek için bkz. Tablolar için sıvı kümelemini kullanma.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;