Corr

col1 및 col2의 Pearson 상관 관계 계수에 대한 새 열을 반환합니다.

문법

from pyspark.sql import functions as sf

sf.corr(col1, col2)

매개 변수

매개 변수	유형	Description
`col1`	`pyspark.sql.Column` 또는 열 이름	상관 관계를 계산하는 첫 번째 열입니다.
`col2`	`pyspark.sql.Column` 또는 열 이름	상관 관계를 계산하는 두 번째 열입니다.

Returns

pyspark.sql.Column: 이러한 두 열 값의 Pearson 상관 관계 계수입니다.

예시

from pyspark.sql import functions as sf
a = range(20)
b = [2 * x for x in range(20)]
df = spark.createDataFrame(zip(a, b), ["a", "b"])
df.agg(sf.corr("a", df.b)).show()

+----------+
|corr(a, b)|
+----------+
|       1.0|
+----------+

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-02-01

다음을 통해 공유

Corr

문법

매개 변수

Returns

예시

피드백

추가 리소스