Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bir olasılık tablosu olarak da bilinen belirli sütunların çift yönlü sıklık tablosunu hesaplar. Her satırın ilk sütunu ayrı değerlerini col1içerir ve sütun adları ise 'nin col2benzersiz değerleridir. İlk sütunun adı şeklindedir $col1_$col2. Yinelemesi olmayan çiftlerin sayısı sıfırdır.
DataFrame.crosstab ve DataFrameStatFunctions.crosstab birbirlerinin diğer adlarıdır.
Sözdizimi
crosstab(col1, col2)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
col1 |
str | İlk sütunun adı. Ayrı öğeler her satırın ilk sütununu oluşturur. |
col2 |
str | İkinci sütunun adı. Elde edilen öğesinin sütun adlarını DataFrameayrı öğeler oluşturur. |
İadeler
DataFrame
Örnekler
df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.stat.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11| 8|
# +-----+---+---+---+
# | 1| 0| 2| 0|
# | 3| 1| 0| 0|
# | 4| 0| 0| 2|
# +-----+---+---+---+