Teilen über


corr Aggregatfunktion

Gilt für:Häkchen für „Ja“ Databricks SQL Häkchen für „Ja“ Databricks Runtime

Gibt den Pearson-Korrelationskoeffizienten zwischen einer Gruppe von Zahlenpaaren zurück.

Syntax

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Diese Funktion kann auch mithilfe der -Klausel als OVER aufgerufen werden.

Argumente

  • expr1: Ein Ausdruck, der zu einem numerischen Ausdruck ausgewertet wird.
  • expr2: Ein Ausdruck, der zu einem numerischen Ausdruck ausgewertet wird.
  • cond: Ein optionaler boolescher Ausdruck, der die Zeilen filtern, die für die Aggregation verwendet werden.

Rückgabe

Ein DOUBLE.

Wenn DISTINCT angegeben wird, wird die Funktion nur für einen eindeutigen Satz von expr1-, expr2-Paaren ausgeführt.

Beispiele

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0