DataFrame.DropDuplicates 方法
定義
重要
部分資訊涉及發行前產品,在發行之前可能會有大幅修改。 Microsoft 對此處提供的資訊,不做任何明確或隱含的瑕疵擔保。
多載
DropDuplicates(String, String[]) |
傳回已移除重復資料列的新 |
DropDuplicates() |
傳回新的 |
DropDuplicates(String, String[])
傳回已移除重復資料列的新 DataFrame
,只考慮資料行的子集。
public Microsoft.Spark.Sql.DataFrame DropDuplicates (string col, params string[] cols);
member this.DropDuplicates : string * string[] -> Microsoft.Spark.Sql.DataFrame
Public Function DropDuplicates (col As String, ParamArray cols As String()) As DataFrame
參數
- col
- String
資料行名稱
- cols
- String[]
其他資料行名稱
傳回
DataFrame 物件
適用於
DropDuplicates()
傳回新的 DataFrame
,其中包含這個 DataFrame
的唯一資料列。
這是 Distinct () 的別名。
public Microsoft.Spark.Sql.DataFrame DropDuplicates ();
member this.DropDuplicates : unit -> Microsoft.Spark.Sql.DataFrame
Public Function DropDuplicates () As DataFrame