적용 대상:yes Databricks Runtime 18.1 이상으로 ![]()
정수 요약이 포함된 여러 TupleSketch 이진 표현을 병합된 단일 스케치로 통합합니다. 이 함수를 사용하여 여러 파티션 또는 데이터 원본의 미리 집계된 스케치를 결합합니다.
문법
tuple_union_agg_integer ( sketch [, lgNomEntries [, mode ]] )
Arguments
- sketch: 정수 요약이 있는 이진 형식의 TupleSketch입니다(예: tuple_sketch_agg_integer).
-
lgNomEntries: 공용 구조체에 대한 명목 항목의 log-base-2를 지정하는 선택적
INTEGER리터럴입니다. 4에서 26 사이여야 합니다. 기본값은 12입니다. -
mode: 중복 키 요약을 결합하기 위한 집계 모드를 지정하는 선택적
STRING리터럴입니다. 유효한 값:'sum','min','max''alwaysone'. 기본값은'sum'입니다.
Returns
BINARY 정수 요약이 포함된 병합된 TupleSketch를 포함하는 값입니다.
비고
-
NULL입력 스케치는 집계 중에 무시됩니다. - 통합 작업은 lgNomEntries 값이 다른 경우에도 스케치를 결합합니다.
- 정확히 두 개의 스케치를 병합하려면 스칼라 tuple_union_integer 함수를 사용합니다.
오류 메시지
예시
-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_integer(tuple_union_agg_integer(sketch)) FROM (
SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 5), (2, 10) tab(key, summary)
UNION ALL
SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 3), (3, 7) tab(key, summary)
);
3.0