corr
агрегатная функция
Область применения: Databricks SQL Databricks Runtime
Возвращает коэффициент Пирсона корреляции между группой пар чисел.
Синтаксис
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Эту функцию также можно вызвать как оконную функцию с помощью OVER
предложения .
Аргументы
expr1
: выражение, результатом которого является числовое значение.expr2
: выражение, результатом которого является числовое значение.cond
: необязательное логическое выражение, фильтрующее строки, используемые для агрегирования.
Возвращает
ДВОЙНОЙ.
Если DISTINCT
указан параметр , функция работает только с уникальным набором expr1
пар . expr2
Примеры
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0