Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Oblicza korelację dwóch kolumn jako DataFrame podwójnej wartości. Obecnie obsługuje tylko współczynnik korelacji Pearson.
DataFrame.corr i DataFrameStatFunctions.corr są aliasami siebie nawzajem.
Składnia
corr(col1, col2, method=None)
Parametry
| Parameter | Typ | Opis |
|---|---|---|
col1 |
str | Nazwa pierwszej kolumny. |
col2 |
str | Nazwa drugiej kolumny. |
method |
str, opcjonalnie | Metoda korelacji. Obecnie obsługuje tylko "pearson". |
Zwroty
float
Examples
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.stat.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.stat.corr("small", "bigger")
# 1.0