pandas_api

A meglévő DataFrame-et pandas-on-Spark DataFrame-gé alakítja át.

Szemantika

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

Paraméterek

Paraméter Típus Leírás
index_col str vagy str lista, nem kötelező Tábla indexoszlopa a Sparkban.

Visszatérítések

PandasOnSparkDataFrame

Jegyzetek

Ha a pandas-on-Spark DataFrame Spark DataFrame-ként lesz konvertálva, majd visszaáll a pandas-on-Sparkra, elveszíti az indexadatokat, és az eredeti index normál oszlopmá alakul.

Ez csak akkor érhető el, ha a Pandas telepítve van és elérhető.

Examples

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob