適用対象:
Databricks SQL
Databricks Runtime 18.0 以降" とマークされているチェック
2 つの Theta Sketch バイナリ表現のセット差 (A - B) を計算します。 返されるスケッチには、最初のスケッチに表示される値のみが含まれますが、2 番目のスケッチには含まれません。
構文
theta_difference ( first, second )
論争
- 最初: バイナリ形式 (セット A) の Theta スケッチ。
- 2 番目: バイナリ形式の Theta スケッチ (セット B)。
返品ポリシー
セット差 (A - B) を表すシリアル化された Theta スケッチを含む BINARY 値。
注記
- 操作は可換ではありません:
theta_difference(A, B)≠theta_difference(B, A)。 - 結果には、最初のスケッチに表示される値が含まれますが、2 番目のスケッチには表示されません。
エラー メッセージ
例示
-- Find values in first sketch but not in second
> SELECT theta_sketch_estimate(theta_difference(theta_sketch_agg(col1), theta_sketch_agg(col2)))
FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2