corr (Кадр данных)

Вычисляет корреляцию двух столбцов кадра данных как двойное значение. В настоящее время поддерживается только коэффициент корреляции Pearson. DataFrame.corr и DataFrameStatFunctions.corr являются псевдонимами друг друга.

Синтаксис

corr(col1: str, col2: str, method: Optional[str] = None)

Параметры

Параметр Тип Описание
col1 str Имя первого столбца.
col2 str Имя второго столбца.
method str, необязательный Метод корреляции. В настоящее время поддерживается только "pearson".

Возвраты

float: Коэффициент корреляции Pearson двух столбцов.

Примеры

df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0