Sdílet prostřednictvím


corr agregační funkce

Platí pro: zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime

Vrátí Pearsonův koeficient korelace mezi skupinou číselných párů.

Syntaxe

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Tuto funkci lze také vyvolat jako funkci okna pomocí OVER klauzule.

Argumenty

  • expr1: Výraz, který se vyhodnotí jako číselný.
  • expr2: Výraz, který se vyhodnotí jako číselný.
  • cond: Volitelný logický výraz filtrující řádky použité pro agregaci.

Návraty

DVOJITÁ.

Pokud DISTINCT je zadána funkce pracuje pouze s jedinečnou sadou expr1expr2 dvojic .

Příklady

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0