Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Menghitung tabel frekuensi sepasang yang bijaksana dari kolom yang diberikan. Juga dikenal sebagai tabel kontingensi. Kolom pertama dari setiap baris akan menjadi nilai yang berbeda dan col1 nama kolom akan menjadi nilai yang berbeda dari col2. Nama kolom pertama akan menjadi $col1_$col2. Pasangan yang tidak memiliki kemunculan akan memiliki nol sebagai hitungannya.
DataFrame.crosstab dan DataFrameStatFunctions.crosstab adalah alias.
Sintaksis
crosstab(col1: str, col2: str)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
col1 |
str | Nama kolom pertama. Item yang berbeda akan membuat item pertama dari setiap baris. |
col2 |
str | Nama kolom kedua. Item yang berbeda akan membuat nama kolom DataFrame. |
Pengembalian Barang
DataFrame: Matriks frekuensi dua kolom.
Examples
df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11| 8|
# +-----+---+---+---+
# | 1| 0| 2| 0|
# | 3| 1| 0| 0|
# | 4| 0| 0| 2|
# +-----+---+---+---+