Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A következőkre vonatkozik: Databricks SQL
Databricks Runtime
A csoporton belüli expr
különböző értékeinek becsült számát adja vissza.
Az implementáció a HyperLogLog++ (HLL++) algoritmus sűrű verzióját használja, amely a legkiválásibb számosságbecslési algoritmus.
Az eredmények az alapértelmezett 5%-os értéken belül pontosak, ami a maximális relatív szórás értékéből származik, bár ez az relativeSD
alábbi paraméterrel konfigurálható.
Szintaxis
approx_count_distinct(expr[, relativeSD]) [FILTER ( WHERE cond ) ]
Ez a függvény meghívható ablakfüggvényként is, a OVER
záradék használatával.
Argumentumok
-
expr
: Bármilyen típusú lehet, amelyhez az egyenértékűség definiálva van. -
relativeSD
: Az engedélyezett maximális relatív szórást határozza meg. -
cond
: Nem kötelező logikai kifejezés, amely az összesítéshez használt sorokat szűri.
Visszaküldések
EGY BIGINT.
Példák
> SELECT approx_count_distinct(col1) FROM VALUES (1), (1), (2), (2), (3) tab(col1);
3
> SELECT approx_count_distinct(col1) FILTER(WHERE col2 = 10)
FROM VALUES (1, 10), (1, 10), (2, 10), (2, 10), (3, 10), (1, 12) AS tab(col1, col2);
3