기존 DataFrame을 pandas-on-Spark DataFrame으로 변환합니다.
문법
pandas_api(index_col: Optional[Union[str, List[str]]] = None)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
index_col |
str 또는 str 목록( 선택 사항) | Spark에서 테이블의 인덱스 열입니다. |
Returns
PandasOnSparkDataFrame
Notes
pandas-on-Spark DataFrame이 Spark DataFrame으로 변환된 다음 다시 pandas-on-Spark로 변환되는 경우 인덱스 정보가 손실되고 원래 인덱스가 일반 열로 전환됩니다.
Pandas가 설치되어 있고 사용할 수 있는 경우에만 사용할 수 있습니다.
예제
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.pandas_api()
# age name
# 0 14 Tom
# 1 23 Alice
# 2 16 Bob
df.pandas_api(index_col="age")
# name
# age
# 14 Tom
# 23 Alice
# 16 Bob