Bagikan melalui


tuple_sketch_agg_integerFungsi agregasi

Berlaku untuk:check ditandai ya Databricks Runtime 18.1 ke atas

Membuat Datasketches TupleSketch dari pasangan kunci-nilai di mana kunci digunakan untuk menghitung dan nilai ringkasan bilangan bulat yang berbeda dikumpulkan sesuai dengan mode yang ditentukan.

Syntax

tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • kunci: Ekspresi untuk penghitungan nilai unik. Jenis yang diterima adalah INTEGER, , FLOATLONG, DOUBLE, STRING, BINARY, ARRAY<INTEGER>, dan ARRAY<LONG>.
  • ringkasan: Nilai yang INTEGER akan dikaitkan dengan dan diagregasi untuk setiap kunci.
  • lgNomEntries: Literal opsional INTEGER yang menentukan log-base-2 entri nominal. Harus antara 4 dan 26, inklusif. Defaultnya adalah 12 (4.096 wadah). Nilai yang lebih tinggi memberikan akurasi yang lebih baik tetapi menggunakan lebih banyak memori.
  • mode: Literal opsional STRING yang menentukan mode agregasi untuk ringkasan. Nilai yang valid: 'sum', 'min', 'max', 'alwaysone'. Defaultnya adalah 'sum'.

Pengembalian Barang

BINARY Nilai yang berisi TupleSketch ringkas berseri dengan ringkasan bilangan bulat.

Catatan

  • NULL nilai kunci atau ringkasan diabaikan selama agregasi.
  • String kosong, array byte kosong, dan array kosong diabaikan untuk kunci.
  • Parameter lgNomEntries dan mode harus berupa nilai konstanta.
  • Gunakan tuple_sketch_estimate_integer untuk mendapatkan perkiraan jumlah yang berbeda.
  • Gunakan tuple_sketch_summary_integer untuk mendapatkan nilai ringkasan agregat.

Pesan kesalahan

Contoh

-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0

-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6