Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Kiszámítja az adott oszlopok párszintű gyakorisági táblázatát. Készenléti táblaként is ismert. Az egyes sorok első oszlopa a különböző értékek col1 lesznek, az oszlopnevek pedig a különböző értékek col2. Az első oszlop neve a következő lesz $col1_$col2: . Azok a párok, amelyek nem rendelkeznek előfordulásokkal, a számlálásuk nulla lesz.
DataFrame.crosstab és DataFrameStatFunctions.crosstab aliasok.
Szemantika
crosstab(col1: str, col2: str)
Paraméterek
| Paraméter | Típus | Leírás |
|---|---|---|
col1 |
str | Az első oszlop neve. A különböző elemek az egyes sorok első elemét készítik el. |
col2 |
str | A második oszlop neve. A különböző elemek a DataFrame oszlopneveit készítik el. |
Visszatérítések
DataFrame: Két oszlop frekvenciamátrixa.
Examples
df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11| 8|
# +-----+---+---+---+
# | 1| 0| 2| 0|
# | 3| 1| 0| 0|
# | 4| 0| 0| 2|
# +-----+---+---+---+