Megosztás a következőn keresztül:


corr összesítő függvény

A következőkre vonatkozik:jelölje be az igennel jelölt jelölőnégyzetet Databricks SQL jelölje be az igennel jelölt jelölőnégyzetet Databricks Runtime

A pearson korrelációs együtthatót adja vissza a számpárok egy csoportja között.

Szintaxis

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Ez a függvény ablakfüggvényként is meghívható a OVER záradék használatával.

Argumentumok

  • expr1: Numerikus értéket kiértékelő kifejezés.
  • expr2: Numerikus értéket kiértékelő kifejezés.
  • cond: Nem kötelező logikai kifejezés, amely az összesítéshez használt sorokat szűri.

Visszatérítés

DUPLA.

Ha DISTINCT meg van adva, a függvény csak a párok expr1 egyedi készletén expr2működik.

Példák

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0