tab silang (DataFrame)

Menghitung tabel frekuensi sepasang yang bijaksana dari kolom yang diberikan. Juga dikenal sebagai tabel kontingensi. Kolom pertama dari setiap baris akan menjadi nilai yang berbeda dan col1 nama kolom akan menjadi nilai yang berbeda dari col2. Nama kolom pertama akan menjadi $col1_$col2. Pasangan yang tidak memiliki kemunculan akan memiliki nol sebagai hitungannya. DataFrame.crosstab dan DataFrameStatFunctions.crosstab adalah alias.

Sintaksis

crosstab(col1: str, col2: str)

Parameter-parameternya

Parameter Tipe Deskripsi
col1 str Nama kolom pertama. Item yang berbeda akan membuat item pertama dari setiap baris.
col2 str Nama kolom kedua. Item yang berbeda akan membuat nama kolom DataFrame.

Pengembalian Barang

DataFrame: Matriks frekuensi dua kolom.

Examples

df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11|  8|
# +-----+---+---+---+
# |    1|  0|  2|  0|
# |    3|  1|  0|  0|
# |    4|  0|  0|  2|
# +-----+---+---+---+