corr(DataFrame)

DataFrame의 두 열 상관 관계를 이중 값으로 계산합니다. 현재는 Pearson 상관 관계 계수만 지원합니다. DataFrame.corrDataFrameStatFunctions.corr 서로의 별칭입니다.

문법

corr(col1: str, col2: str, method: Optional[str] = None)

매개 변수

매개 변수 유형 설명
col1 str 첫 번째 열의 이름입니다.
col2 str 두 번째 열의 이름입니다.
method str, 선택 사항 상관 관계 메서드입니다. 현재는 "pearson"만 지원합니다.

Returns

float: 두 열의 Pearson 상관 관계 계수입니다.

예제

df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0