Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Menghitung statistik dasar untuk kolom numerik dan string.
Sintaksis
describe(*cols: Union[str, List[str]])
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
cols |
str, daftar, opsional | Nama kolom atau daftar nama kolom yang akan dijelaskan oleh (default Semua kolom). |
Pengembalian Barang
DataFrame: DataFrame baru yang menjelaskan (menyediakan statistik) yang diberikan DataFrame.
Catatan
Fungsi ini dimaksudkan untuk analisis data eksploratif, karena kami tidak menjamin tentang kompatibilitas mundur dari skema DataFrame yang dihasilkan.
Gunakan ringkasan untuk statistik yang diperluas dan kontrol atas statistik mana yang akan dihitung.
Examples
df = spark.createDataFrame(
[("Bob", 13, 40.3, 150.5), ("Alice", 12, 37.8, 142.3), ("Tom", 11, 44.1, 142.2)],
["name", "age", "weight", "height"],
)
df.describe(['age']).show()
# +-------+----+
# |summary| age|
# +-------+----+
# | count| 3|
# | mean|12.0|
# | stddev| 1.0|
# | min| 11|
# | max| 13|
# +-------+----+
df.describe(['age', 'weight', 'height']).show()
# +-------+----+------------------+-----------------+
# |summary| age| weight| height|
# +-------+----+------------------+-----------------+
# | count| 3| 3| 3|
# | mean|12.0| 40.73333333333333| 145.0|
# | stddev| 1.0|3.1722757341273704|4.763402145525822|
# | min| 11| 37.8| 142.2|
# | max| 13| 44.1| 150.5|
# +-------+----+------------------+-----------------+