Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Vypočítá korelaci dvou sloupců datového rámce jako dvojité hodnoty. V současné době podporuje pouze Pearson korelační koeficient.
DataFrame.corr a DataFrameStatFunctions.corr jsou mezi sebou aliasy.
Syntaxe
corr(col1: str, col2: str, method: Optional[str] = None)
Parametry
| Parameter | Typ | Description |
|---|---|---|
col1 |
str | Název prvního sloupce. |
col2 |
str | Název druhého sloupce. |
method |
str, volitelné | Metoda korelace. V současné době podporuje pouze "pearson". |
Návraty
float: Pearson Correlation Koeficient dvou sloupců.
Příklady
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0