DataFrame.RepartitionByRange 方法
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
重载
| RepartitionByRange(Column[]) |
返回由给定分区表达式分区的新 |
| RepartitionByRange(Int32, Column[]) |
将给定分区表达式分区的新 |
RepartitionByRange(Column[])
返回由给定分区表达式分区的新 DataFrame ,使用 spark.sql.shuffle.partitions 作为分区数。
生成的数据集已分区区域。
public Microsoft.Spark.Sql.DataFrame RepartitionByRange(params Microsoft.Spark.Sql.Column[] partitionExprs);
member this.RepartitionByRange : Microsoft.Spark.Sql.Column[] -> Microsoft.Spark.Sql.DataFrame
Public Function RepartitionByRange (ParamArray partitionExprs As Column()) As DataFrame
参数
- partitionExprs
- Column[]
分区表达式
返回
DataFrame 对象
适用于
RepartitionByRange(Int32, Column[])
将给定分区表达式分区的新 DataFrame 返回到 中 numPartitions。 生成的 DataFrame 是已分区范围。
public Microsoft.Spark.Sql.DataFrame RepartitionByRange(int numPartitions, params Microsoft.Spark.Sql.Column[] partitionExprs);
member this.RepartitionByRange : int * Microsoft.Spark.Sql.Column[] -> Microsoft.Spark.Sql.DataFrame
Public Function RepartitionByRange (numPartitions As Integer, ParamArray partitionExprs As Column()) As DataFrame
参数
- numPartitions
- Int32
分区数
- partitionExprs
- Column[]
分区表达式
返回
DataFrame 对象