Bagikan melalui


Corr

Mengembalikan Kolom baru untuk Koefisien Korelasi Pearson untuk col1 dan col2.

Syntax

from pyspark.sql import functions as sf

sf.corr(col1, col2)

Parameter-parameternya

Pengaturan Tipe Description
col1 pyspark.sql.Column atau nama kolom Kolom pertama untuk menghitung korelasi.
col2 pyspark.sql.Column atau nama kolom Kolom kedua untuk menghitung korelasi.

Pengembalian Barang

pyspark.sql.Column: Koefisien Korelasi Pearson dari dua nilai kolom ini.

Examples

from pyspark.sql import functions as sf
a = range(20)
b = [2 * x for x in range(20)]
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.corr("a", df.b)).show()
+----------+
|corr(a, b)|
+----------+
|       1.0|
+----------+