適用於:
Databricks SQL
執行時間 18.0 及以上版本
計算兩個 Theta Sketch 二元表示的集合交集。 回傳的草圖只包含兩個草圖中出現的數值。
語法
theta_intersection ( first, second )
Arguments
- 第一:二進位格式的 Theta 草圖。
- 第二:二進位格式的Theta素描。
退貨
一個 BINARY 包含序列化 Theta Sketch 的值,代表該交集。
註釋
- 該運算是交換的:theta_intersection(A, B) = theta_intersection(B, A)。
- 結果包含兩個輸入草圖中出現的值。
- 若要交叉超過兩個草圖,請使用聚合
theta_intersection_agg聚合函數函數。
錯誤訊息
- THETA_INVALID_INPUT_SKETCH_BUFFER (THETA無效的輸入草圖緩衝區)
範例
-- Find values appearing in both sketches
> SELECT theta_sketch_estimate(theta_intersection(theta_sketch_agg(col1), theta_sketch_agg(col2)))
FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2