Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Calcula la correlación de dos columnas de como DataFrame un valor doble. Actualmente solo admite el coeficiente de correlación de Pearson.
DataFrame.corr y DataFrameStatFunctions.corr son alias entre sí.
Sintaxis
corr(col1, col2, method=None)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
col1 |
str | Nombre de la primera columna. |
col2 |
str | Nombre de la segunda columna. |
method |
str, opcional | Método de correlación. Actualmente sólo admite "pearson". |
Devoluciones
float
Ejemplos
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.stat.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.stat.corr("small", "bigger")
# 1.0