DataFrame.Collect 方法

定义

返回一个数组,其中包含此 DataFrame中的所有行。

public System.Collections.Generic.IEnumerable<Microsoft.Spark.Sql.Row> Collect ();
member this.Collect : unit -> seq<Microsoft.Spark.Sql.Row>
Public Function Collect () As IEnumerable(Of Row)

返回

行对象

注解

这需要将所有数据移动到应用程序的驱动程序进程中,而对非常大的数据集执行此操作可能会使驱动程序进程崩溃,并出现 OutOfMemoryError。

适用于