corr (DataFrame)

Bir DataFrame'in iki sütununun bağıntısını çift değer olarak hesaplar. Şu anda yalnızca Pearson Bağıntı Katsayısını destekler. DataFrame.corr ve DataFrameStatFunctions.corr birbirlerinin diğer adlarıdır.

Sözdizimi

corr(col1: str, col2: str, method: Optional[str] = None)

Parametreler

Parametre Türü Açıklama
col1 str İlk sütunun adı.
col2 str İkinci sütunun adı.
method str, isteğe bağlı Bağıntı yöntemi. Şu anda yalnızca "pearson" desteklemektedir.

İadeler

float: İki sütunun Pearson Bağıntı Katsayısı.

Örnekler

df = spark.createDataFrame([(1, 12), (10, 1), (19, 8)], ["c1", "c2"])
df.corr("c1", "c2")
# -0.3592106040535498
df = spark.createDataFrame([(11, 12), (10, 11), (9, 10)], ["small", "bigger"])
df.corr("small", "bigger")
# 1.0