Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Вычисляет корреляцию двух столбцов кадра данных как двойное значение. В настоящее время поддерживается только коэффициент корреляции Pearson.
DataFrame.corr и DataFrameStatFunctions.corr являются псевдонимами друг друга.
Синтаксис
corr(col1: str, col2: str, method: Optional[str] = None)
Параметры
| Параметр | Тип | Описание |
|---|---|---|
col1 |
str | Имя первого столбца. |
col2 |
str | Имя второго столбца. |
method |
str, необязательный | Метод корреляции. В настоящее время поддерживается только "pearson". |
Возвраты
float: Коэффициент корреляции Pearson двух столбцов.
Примеры
df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0