Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Sayısal ve dize sütunları için temel istatistikleri hesaplar.
Sözdizimi
describe(*cols: Union[str, List[str]])
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
cols |
str, list, isteğe bağlı | Açıklama ölçütü olarak sütun adı veya sütun adları listesi (varsayılan Tüm sütunlar). |
İadeler
DataFrame: Verilen DataFrame'i tanımlayan (istatistik sağlayan) yeni bir DataFrame.
Notlar
Sonuçta elde edilen DataFrame şemasının geriye dönük uyumluluğu konusunda hiçbir garanti vermediğimiz için bu işlev keşif veri analizine yöneliktir.
Genişletilmiş istatistikler için özet kullanın ve hangi istatistiklerin hesaplandığı üzerinde denetim sağlayın.
Örnekler
df = spark.createDataFrame(
[("Bob", 13, 40.3, 150.5), ("Alice", 12, 37.8, 142.3), ("Tom", 11, 44.1, 142.2)],
["name", "age", "weight", "height"],
)
df.describe(['age']).show()
# +-------+----+
# |summary| age|
# +-------+----+
# | count| 3|
# | mean|12.0|
# | stddev| 1.0|
# | min| 11|
# | max| 13|
# +-------+----+
df.describe(['age', 'weight', 'height']).show()
# +-------+----+------------------+-----------------+
# |summary| age| weight| height|
# +-------+----+------------------+-----------------+
# | count| 3| 3| 3|
# | mean|12.0| 40.73333333333333| 145.0|
# | stddev| 1.0|3.1722757341273704|4.763402145525822|
# | min| 11| 37.8| 142.2|
# | max| 13| 44.1| 150.5|
# +-------+----+------------------+-----------------+