适用于:
Databricks SQL
Databricks Runtime 18.0 及更高版本
计算两个 Theta Sketch 二进制表示形式的集交集。 返回的草图仅包含两个草图中显示的值。
Syntax
theta_intersection ( first, second )
Arguments
- first:采用二进制格式的 Theta Sketch。
- second:采用二进制格式的 Theta Sketch。
退货
一个 BINARY 值,该值包含表示交集的序列化 Theta Sketch。
注释
- 作是通勤的:theta_intersection(A、B) = theta_intersection(B、A)。
- 结果包含两个输入草图中显示的值。
- 若要相交两个以上的草图,请改用聚合
theta_intersection_agg函数函数。
错误消息
例子
-- Find values appearing in both sketches
> SELECT theta_sketch_estimate(theta_intersection(theta_sketch_agg(col1), theta_sketch_agg(col2)))
FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2