CLUSTER BY предложение (TABLE)

Область применения:проверка помечены да Databricks SQL проверка помечены да Databricks Runtime 13.3 LTS и выше проверка помечены да Delta Lake

Определяет ликвидную многомерную кластеризация для таблицы Delta Lake.

Это предложение можно использовать при выполнении указанных ниже условий.

  • Создание таблицы с помощью CREATE TABLE
  • Измените таблицу с помощью ALTER TABLE, чтобы изменить столбцы кластеризация. Чтобы кластерировать строки с измененными столбцами кластеризация, необходимо запустить OPTIMIZE. Обратите внимание, что строки, кластеризованные предыдущими кластеризация столбцами, не затрагиваются.

Обновленные строки не будут автоматически кластеризованы. Запустите OPTIMIZE для повторного кластера обновленных строк..

Дополнительные сведения о жидких кластеризация см. в разделе "Использование кластеризация жидкости" для таблиц Delta

Синтаксис

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

Параметры

  • column_name

    Указывает столбцы таблицы, с помощью которой следует кластеривать данные. Порядок столбцов не имеет значения. Чтобы воспользоваться изменением кластеризация следует запустить OPTIMIZE.

  • NONE

    Отключает кластеризация для измененной таблицы. Недавно вставленные или обновленные данные не будут кластеризованы с помощью OPTIMIZE. Чтобы не использовать кластеризация при создании таблицы, опустить CLUSTER BY предложение.

Примеры

Дополнительные примеры см. в разделе "Использование жидких кластеризация для таблиц Delta".

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) USING delta CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;