çapraz (DataFrame)

Verilen sütunların çift yönlü sıklık tablosunu hesaplar. Bir acil durum tablosu olarak da bilinir. Her satırın ilk sütunu benzersiz değerleri col1 , sütun adları ise benzersiz değerleri col2olacaktır. İlk sütunun adı olacaktır $col1_$col2. Yinelemesi olmayan çiftlerin sayısı sıfır olur. DataFrame.crosstab ve DataFrameStatFunctions.crosstab diğer adlardır.

Sözdizimi

crosstab(col1: str, col2: str)

Parametreler

Parametre Türü Açıklama
col1 str İlk sütunun adı. Ayrı öğeler her satırın ilk öğesini oluşturur.
col2 str İkinci sütunun adı. Ayrı öğeler DataFrame'in sütun adlarını oluşturur.

İadeler

DataFrame: İki sütunun frekans matrisi.

Örnekler

df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11|  8|
# +-----+---+---+---+
# |    1|  0|  2|  0|
# |    3|  1|  0|  0|
# |    4|  0|  0|  2|
# +-----+---+---+---+