Udostępnij za pośrednictwem


percentile_approx funkcja agregacji

Dotyczy:zaznacz pole wyboru oznaczone jako tak Databricks SQL zaznacz pole wyboru oznaczone jako tak Databricks Runtime

Zwraca przybliżony percentyl expr w grupie. Ta funkcja jest synonimem funkcji agregującej approx_percentile.

Składnia

percentile_approx ( [ALL | DISTINCT ] expr, percentile [, accuracy] ) [FILTER ( WHERE cond ) ]

Tę funkcję można również wywołać jako funkcję okna przy użyciu klauzuli OVER.

Argumenty

  • expr: wyrażenie liczbowe.
  • percentile: literał liczbowy z zakresu od 0 do 1 lub tablica wartości liczbowych, z których każda mieści się w przedziale od 0 do 1.
  • accuracy: literał INTEGER większy niż 0. Jeśli zostanie pominięta dokładność, zostanie ustawiona na 10000.
  • cond: opcjonalne wyrażenie logiczne filtrujące wiersze używane do agregacji.

Zwraca

Funkcja agregacji zwraca wyrażenie, które jest najmniejszą wartością w uporządkowanej grupie (posortowanej od najmniej do największej), tak aby nie więcej niż percentile wartości expr jest mniejsza niż wartość lub równa tej wartości. Jeśli percentile jest tablicą percentile_approx, zwraca przybliżoną tablicę percentylową expr dla określonego percentyla.

Parametr accuracy kontroluje dokładność przybliżenia kosztem pamięci. Wyższa wartość dokładności daje lepszą dokładność, 1.0/accuracy jest względnym błędem przybliżenia.

Jeśli DISTINCT jest określona, funkcja działa tylko na unikatowym zestawie wartości expr.

Przykłady

> SELECT percentile_approx(col, array(0.5, 0.4, 0.1), 100)
    FROM VALUES (0), (1), (2), (10) AS tab(col);
 [1,1,0]

> SELECT percentile_approx(col, 0.5, 100)
    FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
 9

> SELECT percentile_approx(DISTINCT col, 0.5, 100)
    FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
 7