Megosztás a következőn keresztül:


CLUSTER BY záradék (TABLE)

A következőkre vonatkozik:jelölje be az igennel jelölt jelölőnégyzetetDatabricks SQL jelölje be az igennel jelölt jelölőnégyzetet Databricks Runtime 13.3 LTS és csak a Delta Lake felett jelölje be az igennel jelölt jelölőnégyzetet

Egy reláció folyékony, többdimenziós fürtözését határozza meg.

Az Azure Databricks az automatikus folyékony fürtözést és a prediktív optimalizálást javasolja az összes Unity Catalog által felügyelt táblához. Ezek a funkciók intelligens optimalizálást biztosítanak az adatelrendezéshez az adathasználati minták alapján.

Ezt a záradékot a következő esetekben használhatja:

  • Tábla létrehozása CREATE TABLEhasználatával.

  • Állítsa be a(z) ALTER TABLE táblázatot a csoportosító oszlopok megváltoztatásához.

    Azokhoz a sorokhoz, amelyek módosított fürtözési oszlopokkal rendelkeznek, a OPTIMIZE-t kell futtatnia. Vegye figyelembe, hogy a korábbi fürtözési oszlopok által fürtözött sorokra nincs hatással.

    A materializált nézetek és a streamelési táblák klaszterezési oszlopai ALTER TABLE segítségével nem módosíthatók.

  • Materializált nézet létrehozása a következővel CREATE MATERIALIZED VIEW: .

  • Egy streamelési tábla létrehozása CREATE STREAMING TABLEhasználatával.

A frissített sorok nem lesznek automatikusan újrafürtítve. Futtassa OPTIMIZE a frissített sorok újraklészterezéséhez.

A folyékony klaszterezéssel kapcsolatos további információkért lásd: Folyékony klaszterezés használata táblákhoz.

Szemantika

CLUSTER BY { ( column_name [, ...] ) |
             AUTO |
             NONE }

Paraméterek

  • column_name

    Annak a kapcsolatnak az oszlopait adja meg, amellyel az adatokat fürtözheti. Az oszlop sorrendje nem számít. A klaszterezés módosításából származó előnyök kihasználásához futtassa a(z) OPTIMIZEparancsot.

  • AUTO

    A következőre vonatkozik:ellenőrzött igen Databricks SQL ellenőrzött igen Databricks Runtime 15.4 és újabb

    Utasítja a Delta Lake-et, hogy automatikusan meghatározza és idővel alkalmazza a legjobb oszlopok fürtözését. A folyékony klaszterezéssel kapcsolatos további információkért lásd: Folyékony klaszterezés használata táblákhoz.

  • NONE

    Kikapcsolja a fürtözést a módosított reláció esetében. Az újonnan beszúrt vagy frissített adatokat nem csoportosítja OPTIMIZE. Ha nem szeretne fürtözést használni egy kapcsolat létrehozásakor, hagyja ki a CLUSTER BY záradékot.

Példák

További példákat a Táblák folyékony fürtözés használata című témakörben talál.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;