Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Verilen sütunların çift yönlü sıklık tablosunu hesaplar. Bir acil durum tablosu olarak da bilinir. Her satırın ilk sütunu benzersiz değerleri col1 , sütun adları ise benzersiz değerleri col2olacaktır. İlk sütunun adı olacaktır $col1_$col2. Yinelemesi olmayan çiftlerin sayısı sıfır olur.
DataFrame.crosstab ve DataFrameStatFunctions.crosstab diğer adlardır.
Sözdizimi
crosstab(col1: str, col2: str)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
col1 |
str | İlk sütunun adı. Ayrı öğeler her satırın ilk öğesini oluşturur. |
col2 |
str | İkinci sütunun adı. Ayrı öğeler DataFrame'in sütun adlarını oluşturur. |
İadeler
DataFrame: İki sütunun frekans matrisi.
Örnekler
df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11| 8|
# +-----+---+---+---+
# | 1| 0| 2| 0|
# | 3| 1| 0| 0|
# | 4| 0| 0| 2|
# +-----+---+---+---+