적용 대상:yes Databricks Runtime 18.1 이상으로 ![]()
정수 요약을 사용하여 두 TupleSketch 이진 표현의 집합 차이(A- 빼기 B)를 계산합니다. 반환된 스케치에는 첫 번째 스케치에 표시되지만 두 번째 스케치에는 나타나지 않는 키만 포함됩니다.
문법
tuple_difference_integer ( first, second )
Arguments
- first: 정수 요약이 있는 이진 형식의 TupleSketch(A 설정)입니다.
- 두 번째: 정수 요약이 있는 이진 형식의 TupleSketch(B 집합)입니다.
Returns
BINARY 집합 차이(A - B)를 나타내는 TupleSketch를 포함하는 값입니다.
비고
- 작업은 커밋되지 않습니다. tuple_difference_integer(A, B) ≠ tuple_difference_integer(B, A).
- 결과에는 두 번째 스케치에 표시되지 않는 첫 번째 스케치의 키가 포함됩니다.
- 첫 번째 스케치의 요약 값은 결과의 키에 대해 유지됩니다.
오류 메시지
예시
> SELECT tuple_sketch_estimate_integer(
tuple_difference_integer(
tuple_sketch_agg_integer(col1, val1),
tuple_sketch_agg_integer(col2, val2)
)
) FROM VALUES (5, 5, 4, 4), (1, 1, 4, 4), (2, 2, 5, 5), (3, 3, 1, 1) tab(col1, val1, col2, val2);
2.0