Описать

Вычисляет базовую статистику для числовых и строковых столбцов.

Синтаксис

describe(*cols: Union[str, List[str]])

Параметры

Параметр Тип Описание
cols str, list, необязательный Имя столбца или список имен столбцов, описываемых по умолчанию (все столбцы по умолчанию).

Возвраты

DataFrame: новый кадр данных, описывающий (предоставляет статистику) заданного кадра данных.

Примечания

Эта функция предназначена для анализа аналитических данных, так как мы не делаем никаких гарантий обратной совместимости схемы результирующего кадра данных.

Используйте сводку для развернутой статистики и контроля над тем, какие статистические данные следует вычислить.

Примеры

df = spark.createDataFrame(
    [("Bob", 13, 40.3, 150.5), ("Alice", 12, 37.8, 142.3), ("Tom", 11, 44.1, 142.2)],
    ["name", "age", "weight", "height"],
)
df.describe(['age']).show()
# +-------+----+
# |summary| age|
# +-------+----+
# |  count|   3|
# |   mean|12.0|
# | stddev| 1.0|
# |    min|  11|
# |    max|  13|
# +-------+----+

df.describe(['age', 'weight', 'height']).show()
# +-------+----+------------------+-----------------+
# |summary| age|            weight|           height|
# +-------+----+------------------+-----------------+
# |  count|   3|                 3|                3|
# |   mean|12.0| 40.73333333333333|            145.0|
# | stddev| 1.0|3.1722757341273704|4.763402145525822|
# |    min|  11|              37.8|            142.2|
# |    max|  13|              44.1|            150.5|
# +-------+----+------------------+-----------------+