çapraz (DataFrameStatFunctions)

Bir olasılık tablosu olarak da bilinen belirli sütunların çift yönlü sıklık tablosunu hesaplar. Her satırın ilk sütunu ayrı değerlerini col1içerir ve sütun adları ise 'nin col2benzersiz değerleridir. İlk sütunun adı şeklindedir $col1_$col2. Yinelemesi olmayan çiftlerin sayısı sıfırdır. DataFrame.crosstab ve DataFrameStatFunctions.crosstab birbirlerinin diğer adlarıdır.

Sözdizimi

crosstab(col1, col2)

Parametreler

Parametre Türü Açıklama
col1 str İlk sütunun adı. Ayrı öğeler her satırın ilk sütununu oluşturur.
col2 str İkinci sütunun adı. Elde edilen öğesinin sütun adlarını DataFrameayrı öğeler oluşturur.

İadeler

DataFrame

Örnekler

df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.stat.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11|  8|
# +-----+---+---+---+
# |    1|  0|  2|  0|
# |    3|  1|  0|  0|
# |    4|  0|  0|  2|
# +-----+---+---+---+