Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Menghitung korelasi dua kolom DataFrame sebagai nilai ganda. Saat ini hanya mendukung Koefisien Korelasi Pearson.
DataFrame.corr dan DataFrameStatFunctions.corr adalah alias satu sama lain.
Sintaksis
corr(col1: str, col2: str, method: Optional[str] = None)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
col1 |
str | Nama kolom pertama. |
col2 |
str | Nama kolom kedua. |
method |
str, opsional | Metode korelasi. Saat ini hanya mendukung "pearson". |
Pengembalian Barang
float: Koefisien Korelasi Pearson dari dua kolom.
Examples
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0