적용 대상:
Databricks SQL
Databricks Runtime 18.0 이상으로 표시
두 개의 Theta Sketch 이진 표현의 집합 차이(A- 빼기 B)를 계산합니다. 반환된 스케치에는 첫 번째 스케치에 표시되지만 두 번째 스케치에는 표시되지 않는 값만 포함됩니다.
문법
theta_difference ( first, second )
Arguments
- first: 이진 형식의 세타 스케치(A 설정).
- 두 번째: 이진 형식의 세타 스케치(B 설정)입니다.
Returns
BINARY 집합 차이(A - B)를 나타내는 직렬화된 Theta Sketch를 포함하는 값입니다.
비고
- 작업이 정류되지 않습니다.
theta_difference(A, B)≠theta_difference(B, A). - 결과에는 첫 번째 스케치에 표시되지만 두 번째 스케치에는 표시되지 않는 값이 포함됩니다.
오류 메시지
예시
-- Find values in first sketch but not in second
> SELECT theta_sketch_estimate(theta_difference(theta_sketch_agg(col1), theta_sketch_agg(col2)))
FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2