Partager via


Fonction d’agrégation corr

S’applique à : case marquée oui Databricks SQL case marquée oui Databricks Runtime

Retourne un coefficient de corrélation de Pearson entre un groupe de paires de nombres.

Syntaxe

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Cette fonction peut également être appelée en tant que fonction de fenêtre à l’aide de la clause OVER.

Arguments

  • expr1 : Expression qui prend une valeur numérique.
  • expr2 : Expression qui prend une valeur numérique.
  • cond : expression booléenne facultative qui filtre les lignes utilisées pour l’agrégation.

Retours

Une valeur DOUBLE.

Si DISTINCT est spécifié, la fonction ne s’applique qu’à un ensemble unique de paires expr1, expr2.

Exemples

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0