CLUSTER BY
предложение (TABLE)
Область применения: Databricks SQL Databricks Runtime 13.3 LTS и выше Delta Lake
Определяет ликвидную многомерную кластеризация для таблицы Delta Lake.
Это предложение можно использовать при выполнении указанных ниже условий.
- Создание таблицы с помощью CREATE TABLE
- Измените таблицу с помощью ALTER TABLE, чтобы изменить столбцы кластеризация. Чтобы кластерировать строки с измененными столбцами кластеризация, необходимо запустить OPTIMIZE. Обратите внимание, что строки, кластеризованные предыдущими кластеризация столбцами, не затрагиваются.
Обновленные строки не будут автоматически кластеризованы. Запустите OPTIMIZE для повторного кластера обновленных строк..
Дополнительные сведения о жидких кластеризация см. в разделе "Использование кластеризация жидкости" для таблиц Delta
Синтаксис
CLUSTER BY { ( column_name [, ...] ] ) |
NONE }
Параметры
-
Указывает столбцы таблицы, с помощью которой следует кластеривать данные. Порядок столбцов не имеет значения. Чтобы воспользоваться изменением кластеризация следует запустить OPTIMIZE.
NONE
Отключает кластеризация для измененной таблицы. Недавно вставленные или обновленные данные не будут кластеризованы с помощью OPTIMIZE. Чтобы не использовать кластеризация при создании таблицы, опустить
CLUSTER BY
предложение.
Примеры
Дополнительные примеры см. в разделе "Использование жидких кластеризация для таблиц Delta".
-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) USING delta CLUSTER BY (a);
-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);
-- Recluster the table
> OPTIMIZE t;
-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;