Aracılığıyla paylaş


tuple_sketch_agg_integer toplama işlevi

Şunun için geçerlidir:evet olarak işaretlendi Databricks Runtime 18.1 ve üzerini denetleyin

Anahtarların ayrı sayım için kullanıldığı ve tamsayı özet değerlerinin belirtilen moda göre toplandığı anahtar-değer çiftlerinden bir Datasketches TupleSketch oluşturur.

Sözdizimi

tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • key: Benzersiz değer sayma ifadesi. Kabul edilen türler , , LONGFLOAT, DOUBLE, , STRING, BINARY, ARRAY<INTEGER>ve ARRAY<LONG>türleridirINTEGER.
  • özet: INTEGER Her anahtar için ilişkilendirilecek ve toplanacak bir değer.
  • lgNomEntries: Nominal girdilerin log-base-2 değerini belirten isteğe bağlı INTEGER değişmez değer. Dahil olmak üzere 4 ile 26 arasında olmalıdır. Varsayılan değer 12'dir (4.096 demet). Daha yüksek değerler daha iyi doğruluk sağlar ancak daha fazla bellek kullanır.
  • mode: Özetler için toplama modunu belirten isteğe bağlı STRING bir değişmez değer. Geçerli değerler: 'sum', 'min', 'max', 'alwaysone'. Varsayılan değer: 'sum'.

İade

Tamsayı BINARY özetleri içeren serileştirilmiş sıkıştırılmış TupleSketch değerini içeren bir değer.

Notes

  • NULL anahtar veya özet değerleri toplama sırasında yoksayılır.
  • Boş dizeler, boş bayt dizileri ve boş diziler anahtarlar için yoksayılır.
  • lgNomEntries ve mode parametreleri sabit değerler olmalıdır.
  • Ayrı sayım tahmini elde etmek için tuple_sketch_estimate_integer kullanın.
  • Toplanan özet değerini almak için tuple_sketch_summary_integer kullanın.

Hata iletileri

Örnekler

-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0

-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6