Menggambarkan

Menghitung statistik dasar untuk kolom numerik dan string.

Sintaksis

describe(*cols: Union[str, List[str]])

Parameter-parameternya

Parameter Tipe Deskripsi
cols str, daftar, opsional Nama kolom atau daftar nama kolom yang akan dijelaskan oleh (default Semua kolom).

Pengembalian Barang

DataFrame: DataFrame baru yang menjelaskan (menyediakan statistik) yang diberikan DataFrame.

Catatan

Fungsi ini dimaksudkan untuk analisis data eksploratif, karena kami tidak menjamin tentang kompatibilitas mundur dari skema DataFrame yang dihasilkan.

Gunakan ringkasan untuk statistik yang diperluas dan kontrol atas statistik mana yang akan dihitung.

Examples

df = spark.createDataFrame(
    [("Bob", 13, 40.3, 150.5), ("Alice", 12, 37.8, 142.3), ("Tom", 11, 44.1, 142.2)],
    ["name", "age", "weight", "height"],
)
df.describe(['age']).show()
# +-------+----+
# |summary| age|
# +-------+----+
# |  count|   3|
# |   mean|12.0|
# | stddev| 1.0|
# |    min|  11|
# |    max|  13|
# +-------+----+

df.describe(['age', 'weight', 'height']).show()
# +-------+----+------------------+-----------------+
# |summary| age|            weight|           height|
# +-------+----+------------------+-----------------+
# |  count|   3|                 3|                3|
# |   mean|12.0| 40.73333333333333|            145.0|
# | stddev| 1.0|3.1722757341273704|4.763402145525822|
# |    min|  11|              37.8|            142.2|
# |    max|  13|              44.1|            150.5|
# +-------+----+------------------+-----------------+