Megosztás a következőn keresztül:


A hll_union függvény

A következőkre vonatkozik:igennel jelölve Databricks SQL igennel jelölve Databricks Runtime 13.3 LTS és újabb

Ez a függvény a HyperLoglog algoritmust használja két vázlat egyetlen vázlatba való összevonásához.

A lekérdezések az eredményként kapott pufferekkel kiszámíthatnak hozzávetőleges egyedi számokat hosszú egészként a hll_sketch_estimate függvénnyel.

Az implementáció az Apache Datasketches kódtárat használja. További információt a HLL-ben talál.

Szintaxis

hll_union ( expr1, expr2 [, allowDifferentLgConfigK ] )

Argumentumok

  • exprN: A BINARY hll_sketch_agg által létrehozott vázlatot tartalmazó kifejezés.
  • allowDifferentLgConfigK: Nem kötelező BOOLEAN kifejezés, amely meghatározza, hogy lehetővé tegye-e két vázlat egyesítését különböző lgConfigK értékekkel. Az alapértelmezett érték: hamis.

Visszaküldések

Egy BINARY puffer, amely a bemeneti kifejezések kombinálásával kiszámított HyperLogLog-vázlatot tartalmazza.

Ha a allowDifferentLgConfigK paraméter igaz, az eredményvázlat a két megadott lgConfigK érték közül a kisebbet használja.

Példák

> SELECT hll_sketch_estimate(
  hll_union(
    hll_sketch_agg(col1),
    hll_sketch_agg(col2)))
  FROM VALUES
    (1, 4),
    (1, 4),
    (2, 5),
    (2, 5),
    (3, 6) AS tab(col1, col2);
  6

> SELECT hll_sketch_estimate(
  hll_union(
    hll_sketch_agg(col1,  4),
    hll_sketch_agg(col2, 21)))
  FROM VALUES
    (1, 4),
    (1, 4),
    (2, 5),
    (2, 5),
    (3, 6) AS tab(col1, col2);
  error