적용 대상:
Databricks SQL
Databricks Runtime 18.0 이상으로 표시
여러 Theta Sketch 버퍼를 사용하고 하나의 결과 버퍼로 교차합니다. 모든 입력 스케치에 표시되는 고유 값의 대략적인 개수를 반환합니다.
문법
theta_intersection_agg ( sketch )
Arguments
-
sketch: 이진 형식의 세타 스케치(예: 집계 함수에서
theta_sketch_agg).
Returns
BINARY 모든 입력 스케치의 교집합을 나타내는 직렬화된 Theta Sketch를 포함하는 값입니다.
비고
-
NULL값은 집계하는 동안 무시됩니다. - 교집합 결과는 모든 입력 스케치에 나타나는 값을 나타냅니다.
- 정확히 두 개의 스케치를 교차하려면 스칼라
theta_intersection함수 를 대신 사용합니다.
오류 메시지
예시
-- Find approximate count of values appearing in all sketches
> SELECT theta_sketch_estimate(theta_intersection_agg(sketch)) FROM (
SELECT theta_sketch_agg(col) AS sketch FROM VALUES (1), (2), (3) AS tab(col)
UNION ALL
SELECT theta_sketch_agg(col) AS sketch FROM VALUES (2), (3), (4) AS tab(col)
UNION ALL
SELECT theta_sketch_agg(col) AS sketch FROM VALUES (3), (4), (5) AS tab(col)
) t;
1