閱讀英文

共用方式為


corr 聚合函數

適用於:標記為「是」 Databricks SQL 標記為「是」 Databricks Runtime

傳回一組數位組之間的相互關聯 Pearson 係數。

語法

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

您可以將此函式以 視窗函式 的形式,使用 OVER 子句來叫用。

引數

  • expr1:得出數值的表達式。
  • expr2:運算結果為數值的表達式。
  • cond:選擇性布爾表示式,篩選用於匯總的數據列。

退貨

雙倍

如果指定 DISTINCT,函式只會在由 expr1expr2 組成的唯一配對組上運作。

範例

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0