適用於:
Databricks 執行時間 18.1 及以上版本
從鍵值對建立 Datasketches 元組草圖,其中鍵用於不同的計數,整數摘要值則依照指定模式彙總。
語法
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Arguments
-
關鍵:唯一值計數的表達式。 公認的類型有
INTEGER、LONG、FLOATARRAY<LONG>DOUBLESTRINGBINARYARRAY<INTEGER>和 。 -
摘要:每個
INTEGER鍵需關聯並彙總的值。 -
lgNomEntries:一個可選
INTEGER的字面值,指定名詞條目的對數基數為2。 必須年齡介於4到26歲之間,包含在內。 預設為 12(4,096 桶)。 較高的數值能提供更好的準確度,但會佔用更多記憶體。 -
模式:一個可選
STRING的文字,指定摘要的聚合模式。 有效值:'sum','min','max','alwaysone', 。 預設值為'sum'。
退貨
BINARY包含序列化的緊湊型 TupleSketch 與整數摘要的值。
註釋
-
NULL在彙整過程中,鍵值或摘要值會被忽略。 - 空字串、空位元組陣列和空陣列則會被忽略,鍵值則會被忽略。
-
lgNomEntries和mode參數必須是常數值。 - 使用 tuple_sketch_estimate_integer 來取得不同的計數估計值。
- 使用 tuple_sketch_summary_integer 取得彙總後的摘要值。
錯誤訊息
範例
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6