適用於:
Databricks SQL
執行時間 18.0 及以上版本
計算兩個Theta Sketch二元表示的集合差(A減B)。 回傳的草圖只包含第一個草圖中出現但第二個草圖沒有的數值。
語法
theta_difference ( first, second )
Arguments
- 第一:二進位格式的 Theta 草圖(集合 A)。
- 第二:二元格式的 Theta 草圖(集合 B)。
退貨
BINARY包含序列化的Theta草圖,代表集合差異(A - B)。
註釋
- 該運算不是交換的:
theta_difference(A, B)≠theta_difference(B, A)。 - 結果包含了第一個草圖中出現但在第二個草圖中沒有的數值。
錯誤訊息
- THETA_INVALID_INPUT_SKETCH_BUFFER (THETA無效的輸入草圖緩衝區)
範例
-- Find values in first sketch but not in second
> SELECT theta_sketch_estimate(theta_difference(theta_sketch_agg(col1), theta_sketch_agg(col2)))
FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2