toArrow

이 DataFrame의 내용을 PyArrow pyarrow.Table로 반환합니다.

Databricks Runtime 15.3에 추가됨

문법

toArrow()

Returns

pyarrow.Table

Notes

이 메서드는 모든 데이터가 드라이버의 메모리에 로드되므로 결과 PyArrow pyarrow.Table 가 작을 것으로 예상되는 경우에만 사용해야 합니다.

PyArrow가 설치되어 있고 사용할 수 있는 경우에만 사용할 수 있습니다.

이 API는 개발자 API입니다.

예제

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.coalesce(1).toArrow()
# pyarrow.Table
# age: int64
# name: string
# ----
# age: [[2,5]]
# name: [["Alice","Bob"]]