corr (DataFrame)

Menghitung korelasi dua kolom DataFrame sebagai nilai ganda. Saat ini hanya mendukung Koefisien Korelasi Pearson. DataFrame.corr dan DataFrameStatFunctions.corr adalah alias satu sama lain.

Sintaksis

corr(col1: str, col2: str, method: Optional[str] = None)

Parameter-parameternya

Parameter Tipe Deskripsi
col1 str Nama kolom pertama.
col2 str Nama kolom kedua.
method str, opsional Metode korelasi. Saat ini hanya mendukung "pearson".

Pengembalian Barang

float: Koefisien Korelasi Pearson dari dua kolom.

Examples

df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0