DataFrame.Summary(String[]) 方法

定义

计算数值列和字符串列的指定统计信息。

public Microsoft.Spark.Sql.DataFrame Summary (params string[] statistics);
member this.Summary : string[] -> Microsoft.Spark.Sql.DataFrame
Public Function Summary (ParamArray statistics As String()) As DataFrame

参数

statistics
String[]

要计算的统计信息

返回

DataFrame 对象

注解

可用统计信息包括:- 计数 - 平均值 - stddev - 最小值 - max - 任意近似百分位数指定为百分比 (,例如 75%)

如果未提供统计信息,此函数将计算 count、mean、stddev、min、近似四分位数 (百分位数,分别为 25%、50% 和 75%) 和最大值。

适用于