CLUSTER BY
záradék (TABLE)
A következőkre vonatkozik: Databricks SQL Databricks Runtime 13.3 LTS és csak a Delta Lake felett
Egy Delta Lake-tábla folyékony, többdimenziós fürtözését határozza meg.
Ezt a záradékot a következő esetekben használhatja:
- Tábla létrehozása a CREATE TABLE használatával
- A fürtözési oszlopok módosításához módosítsa az ALTER TABLE táblát. A módosított fürtözési oszlopokkal rendelkező fürtözési sorokhoz az OPTIMIZE parancsot kell futtatnia. Vegye figyelembe, hogy a korábbi fürtözési oszlopok által fürtözött sorokra nincs hatással.
A frissített sorok nem lesznek automatikusan újrafürtítve. Futtassa az OPTIMIZE parancsot a frissített sorok újrafürtéséhez.
További információ a folyékony fürtözésről: Folyadékfürtök használata Delta-táblákhoz
Syntax
CLUSTER BY { ( column_name [, ...] ] ) |
NONE }
Paraméterek
-
Annak a táblának az oszlopait adja meg, amelyek alapján csoportosítani szeretné az adatokat. Az oszlop sorrendje nem számít. A fürtözés módosításának előnyeinek kihasználásához futtassa az OPTIMIZE parancsot.
NINCS
Kikapcsolja a fürtözést a módosítandó tábla esetében. Az újonnan beszúrt vagy frissített adatokat az OPTIMIZE nem csoportosítja. Ha nem szeretne fürtözést használni egy tábla létrehozásakor, hagyja ki a záradékot
CLUSTER BY
.
Példák
További példákat a Delta-táblák folyékony fürtözésének használata című témakörben talál.
-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) USING delta CLUSTER BY (a);
-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);
-- Recluster the table
> OPTIMIZE t;
-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;