DataFrame.RepartitionByRange 方法

定义

重载

RepartitionByRange(Column[])

返回由给定分区表达式分区的新 DataFrame ,使用 spark.sql.shuffle.partitions 作为分区数。 生成的数据集已分区区域。

RepartitionByRange(Int32, Column[])

将给定分区表达式分区的新 DataFrame 返回到 中 numPartitions。 生成的 DataFrame 是已分区范围。

RepartitionByRange(Column[])

返回由给定分区表达式分区的新 DataFrame ,使用 spark.sql.shuffle.partitions 作为分区数。 生成的数据集已分区区域。

public Microsoft.Spark.Sql.DataFrame RepartitionByRange(params Microsoft.Spark.Sql.Column[] partitionExprs);
member this.RepartitionByRange : Microsoft.Spark.Sql.Column[] -> Microsoft.Spark.Sql.DataFrame
Public Function RepartitionByRange (ParamArray partitionExprs As Column()) As DataFrame

参数

partitionExprs
Column[]

分区表达式

返回

DataFrame 对象

适用于

RepartitionByRange(Int32, Column[])

将给定分区表达式分区的新 DataFrame 返回到 中 numPartitions。 生成的 DataFrame 是已分区范围。

public Microsoft.Spark.Sql.DataFrame RepartitionByRange(int numPartitions, params Microsoft.Spark.Sql.Column[] partitionExprs);
member this.RepartitionByRange : int * Microsoft.Spark.Sql.Column[] -> Microsoft.Spark.Sql.DataFrame
Public Function RepartitionByRange (numPartitions As Integer, ParamArray partitionExprs As Column()) As DataFrame

参数

numPartitions
Int32

分区数

partitionExprs
Column[]

分区表达式

返回

DataFrame 对象

适用于