Share via


corr funzione di aggregazione

Si applica a:check contrassegnato con sì controllo SQL di Databricks contrassegnato con sì Databricks Runtime

Restituisce il coefficiente di Pearson della correlazione tra un gruppo di coppie di numeri.

Sintassi

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Questa funzione può anche essere richiamata come funzione window usando la OVER clausola .

Argomenti

  • expr1: espressione che restituisce un valore numerico.
  • expr2: espressione che restituisce un valore numerico.
  • cond: espressione booleana facoltativa che filtra le righe usate per l'aggregazione.

Restituisce

A DOUBLE.

Se DISTINCT viene specificata, la funzione opera solo su un set univoco di expr1coppie , expr2 .

Esempi

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0