corr
agregační funkce
Platí pro: Databricks SQL Databricks Runtime
Vrátí Pearsonův koeficient korelace mezi skupinou číselných párů.
Syntaxe
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Tuto funkci lze také vyvolat jako funkci okna pomocí OVER
klauzule.
Argumenty
expr1
: Výraz, který se vyhodnotí jako číselný.expr2
: Výraz, který se vyhodnotí jako číselný.cond
: Volitelný logický výraz filtrující řádky použité pro agregaci.
Návraty
DVOJITÁ.
Pokud DISTINCT
je zadána funkce pracuje pouze s jedinečnou sadou expr1
expr2
dvojic .
Příklady
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0