Açıklamak

Sayısal ve dize sütunları için temel istatistikleri hesaplar.

Sözdizimi

describe(*cols: Union[str, List[str]])

Parametreler

Parametre Türü Açıklama
cols str, list, isteğe bağlı Açıklama ölçütü olarak sütun adı veya sütun adları listesi (varsayılan Tüm sütunlar).

İadeler

DataFrame: Verilen DataFrame'i tanımlayan (istatistik sağlayan) yeni bir DataFrame.

Notlar

Sonuçta elde edilen DataFrame şemasının geriye dönük uyumluluğu konusunda hiçbir garanti vermediğimiz için bu işlev keşif veri analizine yöneliktir.

Genişletilmiş istatistikler için özet kullanın ve hangi istatistiklerin hesaplandığı üzerinde denetim sağlayın.

Örnekler

df = spark.createDataFrame(
    [("Bob", 13, 40.3, 150.5), ("Alice", 12, 37.8, 142.3), ("Tom", 11, 44.1, 142.2)],
    ["name", "age", "weight", "height"],
)
df.describe(['age']).show()
# +-------+----+
# |summary| age|
# +-------+----+
# |  count|   3|
# |   mean|12.0|
# | stddev| 1.0|
# |    min|  11|
# |    max|  13|
# +-------+----+

df.describe(['age', 'weight', 'height']).show()
# +-------+----+------------------+-----------------+
# |summary| age|            weight|           height|
# +-------+----+------------------+-----------------+
# |  count|   3|                 3|                3|
# |   mean|12.0| 40.73333333333333|            145.0|
# | stddev| 1.0|3.1722757341273704|4.763402145525822|
# |    min|  11|              37.8|            142.2|
# |    max|  13|              44.1|            150.5|
# +-------+----+------------------+-----------------+