共用方式為


theta_intersection 函數

適用於:勾選標記為是 Databricks SQL 勾選為 Databricks 執行時間 18.0 及以上版本

計算兩個 Theta Sketch 二元表示的集合交集。 回傳的草圖只包含兩個草圖中出現的數值。

語法

theta_intersection ( first, second )

Arguments

  • 第一:二進位格式的 Theta 草圖。
  • 第二:二進位格式的Theta素描。

退貨

一個 BINARY 包含序列化 Theta Sketch 的值,代表該交集。

註釋

  • 該運算是交換的:theta_intersection(A, B) = theta_intersection(B, A)。
  • 結果包含兩個輸入草圖中出現的值。
  • 若要交叉超過兩個草圖,請使用聚theta_intersection_agg聚合函數函數。

錯誤訊息

範例

-- Find values appearing in both sketches
> SELECT theta_sketch_estimate(theta_intersection(theta_sketch_agg(col1), theta_sketch_agg(col2)))
  FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2