Aracılığıyla paylaş


tuple_sketch_agg_double toplama işlevi

Şunun için geçerlidir:evet olarak işaretlendi Databricks Runtime 18.1 ve üzerini denetleyin

Anahtarların ayrı sayım için kullanıldığı ve çift özet değerlerinin belirtilen moda göre toplandığı anahtar-değer çiftlerinden bir Datasketches TupleSketch oluşturur.

Sözdizimi

tuple_sketch_agg_double ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • key: Benzersiz değer sayma ifadesi. Kabul edilen türler , , LONGFLOAT, DOUBLE, , STRING, BINARY, ARRAY<INTEGER>ve ARRAY<LONG>türleridirINTEGER.
  • özet: DOUBLE Her anahtar için ilişkilendirilecek ve toplanacak bir değer.
  • lgNomEntries: Nominal girdilerin log-base-2 değerini belirten isteğe bağlı INTEGER değişmez değer. Dahil olmak üzere 4 ile 26 arasında olmalıdır. Varsayılan değer 12'dir (4.096 demet). Daha yüksek değerler daha iyi doğruluk sağlar ancak daha fazla bellek kullanır.
  • mode: Özetler için toplama modunu belirten isteğe bağlı STRING bir değişmez değer. Geçerli değerler: 'sum', 'min', 'max', 'alwaysone'. Varsayılan değer: 'sum'.

İade

Çift BINARY özetli serileştirilmiş sıkıştırılmış TupleSketch değerini içeren bir değer.

Notes

  • NULL anahtar veya özet değerleri toplama sırasında yoksayılır.
  • Boş dizeler, boş bayt dizileri ve boş diziler anahtarlar için yoksayılır.
  • lgNomEntries ve mode parametreleri sabit değerler olmalıdır.
  • Ayrı sayım tahmini elde etmek için tuple_sketch_estimate_double kullanın.
  • Toplanan özet değerini almak için tuple_sketch_summary_double kullanın.

Hata iletileri

Örnekler

-- Create sketch with sum mode (default)
> SELECT tuple_sketch_estimate_double(tuple_sketch_agg_double(key, summary, 12, 'sum')) FROM VALUES (1, 5.0D), (1, 1.0D), (2, 2.0D), (2, 3.0D), (3, 2.2D) tab(key, summary);
3.0

-- Get aggregated summary
> SELECT tuple_sketch_summary_double(tuple_sketch_agg_double(key, summary)) FROM VALUES (1, 1.0D), (1, 2.0D), (2, 3.0D) tab(key, summary);
6.0