다음을 통해 공유


CLUSTER BY clause(TABLE)

적용 대상:예(예)로 표시된 확인 Databricks SQL 예(예)로 표시된 확인 Databricks Runtime 13.3 LTS 이상 예(예)로 표시된 확인 Delta Lake만 해당

Delta Lake 테이블에 대한 액체 다차원 클러스터링을 정의합니다.

다음과 같은 경우 이 절을 사용할 수 있습니다.

  • CREATE TABLE을 사용하여 테이블 만들기
  • ALTER TABLE을 사용하여 테이블을 변경하여 클러스터링 열을 변경합니다. 변경된 클러스터링 열이 있는 행을 클러스터링하려면 OPTIMIZE를 실행해야 합니다. 이전 클러스터링 열에 의해 클러스터된 행은 영향을 받지 않습니다.

업데이트된 행은 자동으로 다시 클러스터되지 않습니다. OPTIMIZE를 실행하여 업데이트된 행을 다시 클러스터합니다.

액체 클러스터링에 대한 자세한 내용은 델타 테이블에 액체 클러스터링 사용을 참조 하세요.

구문

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

매개 변수

  • column_name

    데이터를 클러스터할 테이블의 열을 지정합니다. 열 순서는 중요하지 않습니다. 클러스터링 변경을 활용하려면 OPTIMIZE를 실행해야 합니다.

  • 없음

    변경 중인 테이블에 대한 클러스터링을 해제합니다. 새로 삽입되거나 업데이트된 데이터는 OPTIMIZE에 의해 클러스터되지 않습니다. 테이블을 만들 때 클러스터링을 사용하지 않려면 절을 생략합니다 CLUSTER BY .

예제

델타 테이블에 액체 클러스터링 사용에서 더 많은 예제를 찾을 수 있습니다.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;