Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Egy DataFrame két oszlopának korrelációját számítja ki kettős értékként. Jelenleg csak a Pearson korrelációs együtthatót támogatja.
DataFrame.corr és DataFrameStatFunctions.corr egymás aliasai.
Szemantika
corr(col1: str, col2: str, method: Optional[str] = None)
Paraméterek
| Paraméter | Típus | Leírás |
|---|---|---|
col1 |
str | Az első oszlop neve. |
col2 |
str | A második oszlop neve. |
method |
str, nem kötelező | A korrelációs módszer. Jelenleg csak a "pearson" támogatott. |
Visszatérítések
lebegőpontos: Két oszlop Pearson korrelációs együtthatója.
Examples
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0