Aracılığıyla paylaş


hll_sketch_agg toplama işlevi

Şunlar için geçerlidir: onay işareti evet olarak işaretlenmiş Databricks SQL onay işareti evet olarak işaretlenmiş Databricks Runtime 13.3 LTS ve üzeri

Bu işlev, hyperloglog algoritmasını kullanarak belirli bir sütundaki benzersiz değer sayısının olasılıksal yaklaşık değerini sayar ve sonucu taslak arabelleği olarak bilinen ikili bir gösterim olarak verir. Bu ikili gösterim kalıcılık için uygundur.

Sorgular, hll_sketch_estimate işleviyle yaklaşık benzersiz sayıları hesaplamak için sonuçta elde edilen arabellekleri kullanabilir.

hll_union ve hll_union_agg işlevleri de bu arabellekleri giriş olarak kullanarak ve birleştirerek taslakları birleştirebilir.

Uygulama Apache Datasketches kitaplığını kullanır. Daha fazla bilgi için bkz . HLL .

Sözdizimi

hll_sketch_agg ( expr [, lgConfigK ] )

Bu işlev yan tümcesi OVER kullanılarak bir pencere işlevi olarak da çağrılabilir.

Bağımsız değişkenler

  • expr: Benzersiz sayım yapılacak , BIGINT, STRINGveya BINARY türünde INTbir ifade.
  • lgConfigK: Varsayılan 12 ile 4 ile 21 arasında isteğe bağlı INT sabit. K'nin günlük tabanı-2, burada K, taslak için demet veya yuva sayısıdır.

içindekiler NULL expr yoksayılır.

Döndürülenler

Toplama grubundaki tüm giriş değerlerinin tüketilmesi ve toplanması sonucu hesaplanan HyperLogLog taslağını içeren arabellek olmayanNULL BINARY bir.

Örnekler

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3