CLUSTER BY عبارة (TABLE)

ينطبق على:وضع علامة Databricks SQL وضع علامة Databricks Runtime 13.3 LTS وأعلى وضع علامة Delta Lake فقط

تعريف المجموعات السائلة متعددة الأبعاد لجدول Delta Lake.

يمكنك استخدام هذه العبارة عند:

  • إنشاء جدول باستخدام CREATE TABLE
  • قم بتغيير جدول باستخدام ALTER TABLE لتغيير أعمدة التجميع. إلى صفوف نظام المجموعة مع أعمدة تكوين أنظمة المجموعات المتغيرة، يجب تشغيل OPTIMIZE. لاحظ أن الصفوف التي تم تجميعها بواسطة أعمدة التجميع السابقة لا تتأثر.

لا يتم إعادة تجميع الصفوف المحدثة تلقائيا. قم بتشغيل OPTIMIZE لإعادة تجميع الصفوف المحدثة.

لمزيد من المعلومات حول تكوين أنظمة المجموعات السائلة، راجع استخدام التجميع السائل لجداول دلتا

بناء الجملة

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

المعلمات

  • column_name

    يحدد أعمدة الجدول التي يتم تجميع البيانات من خلالها. ترتيب العمود غير مهم. للاستفادة من تغيير نظام المجموعة، يجب تشغيل OPTIMIZE.

  • اي

    إيقاف تشغيل التجميع للجدول الذي يتم تغييره. لن يتم تجميع البيانات المدرجة أو المحدثة حديثا بواسطة OPTIMIZE. لعدم استخدام نظام المجموعة عند إنشاء جدول، احذف العبارة CLUSTER BY .

الأمثلة

يمكنك العثور على المزيد من الأمثلة في استخدام التجميع السائل لجداول Delta.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;