toPandas

이 DataFrame의 내용을 Pandas로 반환합니다 pandas.DataFrame.

문법

toPandas()

Returns

pandas.DataFrame

Notes

이 메서드는 모든 데이터가 드라이버의 메모리에 로드되므로 결과 Pandas pandas.DataFrame 가 작을 것으로 예상되는 경우에만 사용해야 합니다.

spark.sql.execution.arrow.pyspark.enabled=True 사용량은 실험적입니다.

Pandas가 설치되어 있고 사용할 수 있는 경우에만 사용할 수 있습니다.

예제

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.toPandas()
#    age   name
# 0    2  Alice
# 1    5    Bob