corr (DataFrameStatFunctions)

Vypočítá korelaci dvou sloupců dvou sloupců DataFrame jako dvojité hodnoty. V současné době podporuje pouze Pearson korelační koeficient. DataFrame.corr a DataFrameStatFunctions.corr jsou mezi sebou aliasy.

Syntaxe

corr(col1, col2, method=None)

Parametry

Parameter Typ Description
col1 str Název prvního sloupce.
col2 str Název druhého sloupce.
method str, volitelné Metoda korelace. V současné době podporuje pouze "pearson".

Návraty

float

Příklady

df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.stat.corr("c1", "c2")
# -0.3592106040535498

df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.stat.corr("small", "bigger")
# 1.0