DataFrame.Summary(String[]) 方法
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
计算数值列和字符串列的指定统计信息。
public Microsoft.Spark.Sql.DataFrame Summary (params string[] statistics);
member this.Summary : string[] -> Microsoft.Spark.Sql.DataFrame
Public Function Summary (ParamArray statistics As String()) As DataFrame
参数
- statistics
- String[]
要计算的统计信息
返回
DataFrame 对象
注解
可用统计信息包括:- 计数 - 平均值 - stddev - 最小值 - max - 任意近似百分位数指定为百分比 (,例如 75%)
如果未提供统计信息,此函数将计算 count、mean、stddev、min、近似四分位数 (百分位数,分别为 25%、50% 和 75%) 和最大值。
适用于
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈