Поделиться через


Агрегатная функция corr

Область применения: флажок Databricks SQL флажок Databricks Runtime

Возвращает коэффициент Пирсона для корреляции между группой пар чисел.

Синтаксис

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Эту функцию также можно вызвать как функцию окна с помощью OVER предложения.

Аргументы

  • expr1: выражение, значением которого является число.
  • expr2: выражение, значением которого является число.
  • cond: необязательное логическое выражение для фильтрации строк, используемых для агрегирования.

Возвраты

Значение DOUBLE.

Если задано значение DISTINCT, функция работает только с уникальным набором значений пар expr1, expr2.

Примеры

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0