Megosztás a következőn keresztül:


CLUSTER BY záradék (TABLE)

A következőkre vonatkozik:jelölje be az igennel jelölt jelölőnégyzetet Databricks SQL jelölje be az igennel jelölt jelölőnégyzetet Databricks Runtime 13.3 LTS és csak a Delta Lake felett jelölje be az igennel jelölt jelölőnégyzetet

Egy Delta Lake-tábla folyékony, többdimenziós fürtözését határozza meg.

Ezt a záradékot a következő esetekben használhatja:

  • Tábla létrehozása a CREATE TABLE használatával
  • A fürtözési oszlopok módosításához módosítsa az ALTER TABLE táblát. A módosított fürtözési oszlopokkal rendelkező fürtözési sorokhoz az OPTIMIZE parancsot kell futtatnia. Vegye figyelembe, hogy a korábbi fürtözési oszlopok által fürtözött sorokra nincs hatással.

A frissített sorok nem lesznek automatikusan újrafürtítve. Futtassa az OPTIMIZE parancsot a frissített sorok újrafürtéséhez.

További információ a folyékony fürtözésről: Folyadékfürtök használata Delta-táblákhoz

Syntax

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

Paraméterek

  • column_name

    Annak a táblának az oszlopait adja meg, amelyek alapján csoportosítani szeretné az adatokat. Az oszlop sorrendje nem számít. A fürtözés módosításának előnyeinek kihasználásához futtassa az OPTIMIZE parancsot.

  • NINCS

    Kikapcsolja a fürtözést a módosítandó tábla esetében. Az újonnan beszúrt vagy frissített adatokat az OPTIMIZE nem csoportosítja. Ha nem szeretne fürtözést használni egy tábla létrehozásakor, hagyja ki a záradékot CLUSTER BY .

Példák

További példákat a Delta-táblák folyékony fürtözésének használata című témakörben talál.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) USING delta CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;