다음을 통해 공유


theta_difference 함수

적용 대상:yes Databricks SQL 확인 표시 예 Databricks Runtime 18.0 이상으로 표시

두 개의 Theta Sketch 이진 표현의 집합 차이(A- 빼기 B)를 계산합니다. 반환된 스케치에는 첫 번째 스케치에 표시되지만 두 번째 스케치에는 표시되지 않는 값만 포함됩니다.

문법

theta_difference ( first, second )

Arguments

  • first: 이진 형식의 세타 스케치(A 설정).
  • 두 번째: 이진 형식의 세타 스케치(B 설정)입니다.

Returns

BINARY 집합 차이(A - B)를 나타내는 직렬화된 Theta Sketch를 포함하는 값입니다.

비고

  • 작업이 정류되지 않습니다. theta_difference(A, B)theta_difference(B, A).
  • 결과에는 첫 번째 스케치에 표시되지만 두 번째 스케치에는 표시되지 않는 값이 포함됩니다.

오류 메시지

예시

-- Find values in first sketch but not in second
> SELECT theta_sketch_estimate(theta_difference(theta_sketch_agg(col1), theta_sketch_agg(col2)))
  FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2