Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan Kolom baru untuk Koefisien Korelasi Pearson untuk col1 dan col2.
Syntax
from pyspark.sql import functions as sf
sf.corr(col1, col2)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
col1 |
pyspark.sql.Column atau nama kolom |
Kolom pertama untuk menghitung korelasi. |
col2 |
pyspark.sql.Column atau nama kolom |
Kolom kedua untuk menghitung korelasi. |
Pengembalian Barang
pyspark.sql.Column: Koefisien Korelasi Pearson dari dua nilai kolom ini.
Examples
from pyspark.sql import functions as sf
a = range(20)
b = [2 * x for x in range(20)]
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.corr("a", df.b)).show()
+----------+
|corr(a, b)|
+----------+
| 1.0|
+----------+