DataFrame.DropDuplicates 方法

定義

多載

DropDuplicates(String, String[])

傳回已移除重復資料列的新 DataFrame ,只考慮資料行的子集。

DropDuplicates()

傳回新的 DataFrame ,其中包含這個 DataFrame 的唯一資料列。 這是 Distinct () 的別名。

DropDuplicates(String, String[])

傳回已移除重復資料列的新 DataFrame ,只考慮資料行的子集。

public Microsoft.Spark.Sql.DataFrame DropDuplicates (string col, params string[] cols);
member this.DropDuplicates : string * string[] -> Microsoft.Spark.Sql.DataFrame
Public Function DropDuplicates (col As String, ParamArray cols As String()) As DataFrame

參數

col
String

資料行名稱

cols
String[]

其他資料行名稱

傳回

DataFrame 物件

適用於

DropDuplicates()

傳回新的 DataFrame ,其中包含這個 DataFrame 的唯一資料列。 這是 Distinct () 的別名。

public Microsoft.Spark.Sql.DataFrame DropDuplicates ();
member this.DropDuplicates : unit -> Microsoft.Spark.Sql.DataFrame
Public Function DropDuplicates () As DataFrame

傳回

適用於