hll_union_agg fungsi

Berlaku untuk:centang ditandai ya Databricks SQL centang ditandai ya Databricks Runtime 13.3 LTS ke atas

Fungsi ini menggunakan algoritma HyperLogLog untuk menggabungkan sekelompok sketsa menjadi satu.

Kueri dapat menggunakan buffer yang dihasilkan untuk menghitung perkiraan jumlah unik dengan fungsi hll_sketch_estimate .

Implementasi menggunakan pustaka Apache Datasketches. Silakan lihat HLL untuk informasi lebih lanjut.

Sintaks

hll_union_agg ( expr [, allowDifferentLgConfigK ] )

Fungsi ini juga dapat dipanggil sebagai fungsi jendela menggunakan OVER klausa.

Argumen

  • expr: Ekspresi BINARY yang menyimpan sketsa yang dihasilkan oleh hll_sketch_agg.
  • allowDifferentLgConfigK: Ekspresi konstan opsional BOOLEAN yang mengontrol apakah akan mengizinkan penggabungan sketsa dengan nilai lgConfigK yang berbeda. Nilai defaultnya adalah false.

Mengembalikan

BINARY Buffer yang berisi sketsa HyperLogLog dihitung sebagai hasil dari menggabungkan ekspresi input dari grup yang sama.

allowDifferentLgConfigK Ketika parameter benar, sketsa hasil menggunakan nilai yang lebih kecil dari dua nilai yang disediakanlgConfigK.

Contoh

> SELECT hll_sketch_estimate(hll_union_agg(sketch, true))
    FROM (SELECT hll_sketch_agg(col) as sketch
            FROM VALUES (1) AS tab(col)
          UNION ALL
          SELECT hll_sketch_agg(col, 20) as sketch
            FROM VALUES (1) AS tab(col));
  1

> SELECT hll_sketch_estimate(hll_union_agg(sketch, false))
    FROM (SELECT hll_sketch_agg(col) as sketch
            FROM VALUES (1) AS tab(col)
          UNION ALL
          SELECT hll_sketch_agg(col, 20) as sketch
            FROM VALUES (1) AS tab(col));
  error