percentile_approx funzione di aggregazione

Si applica a:check contrassegnato con sì controllo SQL di Databricks contrassegnato con sì Databricks Runtime

Restituisce il percentile approssimativo dell'oggetto expr all'interno del gruppo. Questa funzione è un sinonimo di approx_percentile funzione di aggregazione.

Sintassi

percentile_approx ( [ALL | DISTINCT ] expr, percentile [, accuracy] ) [FILTER ( WHERE cond ) ]

Questa funzione può anche essere richiamata come funzione window usando la OVER clausola .

Argomenti

  • expr: espressione numerica.
  • percentile: valore letterale numerico compreso tra 0 e 1 o una matrice letterale di valori numerici, ognuno compreso tra 0 e 1.
  • accuracy: valore letterale INTEGER maggiore di 0. Se l'accuratezza viene omessa, viene impostata su 10000.
  • cond: espressione booleana facoltativa che filtra le righe usate per l'aggregazione.

Restituisce

La funzione di aggregazione restituisce l'espressione che è il valore più piccolo nel gruppo ordinato (ordinato da meno a maggiore) in modo che non più di percentileexpr valori sia minore del valore o uguale a tale valore. Se percentile è una matrice percentile_approx, restituisce la matrice percentile approssimativa di expr in corrispondenza del percentile specificato.

Il accuracy parametro controlla l'accuratezza dell'approssimazione al costo della memoria. Un valore più elevato di accuratezza restituisce una migliore accuratezza, 1.0/accuracy è l'errore relativo dell'approssimazione.

Se DISTINCT viene specificata, la funzione opera solo su un set univoco di expr valori.

Esempi

> SELECT percentile_approx(col, array(0.5, 0.4, 0.1), 100)
    FROM VALUES (0), (1), (2), (10) AS tab(col);
 [1,1,0]

> SELECT percentile_approx(col, 0.5, 100)
    FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
 9

> SELECT percentile_approx(DISTINCT col, 0.5, 100)
    FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
 7