共用方式為


theta_difference 函數

適用於:勾選標記為是 Databricks SQL 勾選為 Databricks 執行時間 18.0 及以上版本

計算兩個Theta Sketch二元表示的集合差(A減B)。 回傳的草圖只包含第一個草圖中出現但第二個草圖沒有的數值。

語法

theta_difference ( first, second )

Arguments

  • 第一:二進位格式的 Theta 草圖(集合 A)。
  • 第二:二元格式的 Theta 草圖(集合 B)。

退貨

BINARY包含序列化的Theta草圖,代表集合差異(A - B)。

註釋

  • 該運算不是交換的: theta_difference(A, B)theta_difference(B, A)
  • 結果包含了第一個草圖中出現但在第二個草圖中沒有的數值。

錯誤訊息

範例

-- Find values in first sketch but not in second
> SELECT theta_sketch_estimate(theta_difference(theta_sketch_agg(col1), theta_sketch_agg(col2)))
  FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2