corr (DataFrameStatFunctions)

Oblicza korelację dwóch kolumn jako DataFrame podwójnej wartości. Obecnie obsługuje tylko współczynnik korelacji Pearson. DataFrame.corr i DataFrameStatFunctions.corr są aliasami siebie nawzajem.

Składnia

corr(col1, col2, method=None)

Parametry

Parameter	Typ	Opis
`col1`	str	Nazwa pierwszej kolumny.
`col2`	str	Nazwa drugiej kolumny.
`method`	str, opcjonalnie	Metoda korelacji. Obecnie obsługuje tylko `"pearson"`.

Zwroty

float

Examples

df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.stat.corr("c1", "c2")
# -0.3592106040535498

df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.stat.corr("small", "bigger")
# 1.0

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-19