RelationalGroupedDataset 类
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
用于对数据帧进行聚合的一组方法。
public sealed class RelationalGroupedDataset
type RelationalGroupedDataset = class
Public NotInheritable Class RelationalGroupedDataset
- 继承
-
RelationalGroupedDataset
方法
Agg(Column, Column[]) |
通过指定一系列聚合列来计算聚合。 |
Apply(StructType, Func<DataFrame,DataFrame>) |
使用 UDF 映射当前数据帧的每个组,并将结果作为数据帧返回。 用户定义函数应采用 并返回另一个 DataFrameDataFrame。 对于每个组,所有列作为 一起 DataFrame 传递给用户函数,返回的 FxDataFrame 合并为数据帧。 返回的 DataFrame 可以是任意长度,并且其架构必须与 匹配 |
Apply(StructType, Func<RecordBatch,RecordBatch>) |
使用 UDF 映射当前数据帧的每个组,并将结果作为数据帧返回。 用户定义的函数应采用 Apache Arrow RecordBatch 并返回另一个 Apache Arrow RecordBatch。 对于每个组,所有列作为 RecordBatch 一起传递给用户函数,返回的 RecordBatch 将合并为数据帧。 返回的 Apache.Arrow.RecordBatch 可以是任意长度,并且其架构必须与 匹配 |
Avg(String[]) |
计算每个组的每个数值列的平均值。 |
Count() |
计算每个组的行数。 |
Max(String[]) |
计算每个组的每个数值列的最大值。 |
Mean(String[]) |
计算每个组的每个数值列的平均值。 |
Min(String[]) |
计算每个组的每个数值列的最小值。 |
Pivot(Column) |
透视当前数据帧的列并执行指定的聚合。 |
Pivot(Column, IEnumerable<Object>) |
透视当前数据帧的列并执行指定的聚合。 |
Pivot(String) |
透视当前数据帧的列并执行指定的聚合。 |
Pivot(String, IEnumerable<Object>) |
透视当前数据帧的列并执行指定的聚合。 |
Sum(String[]) |
计算每个组的每个数值列的总和。 |
适用于
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈