다음을 통해 공유


tuple_union_agg_integer 집계 함수

적용 대상:yes Databricks Runtime 18.1 이상으로 표시된 확인

정수 요약이 포함된 여러 TupleSketch 이진 표현을 병합된 단일 스케치로 통합합니다. 이 함수를 사용하여 여러 파티션 또는 데이터 원본의 미리 집계된 스케치를 결합합니다.

문법

tuple_union_agg_integer ( sketch [, lgNomEntries [, mode ]] )

Arguments

  • sketch: 정수 요약이 있는 이진 형식의 TupleSketch입니다(예: tuple_sketch_agg_integer).
  • lgNomEntries: 공용 구조체에 대한 명목 항목의 log-base-2를 지정하는 선택적 INTEGER 리터럴입니다. 4에서 26 사이여야 합니다. 기본값은 12입니다.
  • mode: 중복 키 요약을 결합하기 위한 집계 모드를 지정하는 선택적 STRING 리터럴입니다. 유효한 값: 'sum', 'min', 'max''alwaysone'. 기본값은 'sum'입니다.

Returns

BINARY 정수 요약이 포함된 병합된 TupleSketch를 포함하는 값입니다.

비고

  • NULL 입력 스케치는 집계 중에 무시됩니다.
  • 통합 작업은 lgNomEntries 값이 다른 경우에도 스케치를 결합합니다.
  • 정확히 두 개의 스케치를 병합하려면 스칼라 tuple_union_integer 함수를 사용합니다.

오류 메시지

예시

-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_integer(tuple_union_agg_integer(sketch)) FROM (
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 5), (2, 10) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 3), (3, 7) tab(key, summary)
  );
3.0