pandas_api

Převede existující datový rámec na datový rámec pandas-on-Spark.

Syntaxe

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

Parametry

Parameter Typ Description
index_col str nebo list of str, optional Indexovací sloupec tabulky ve Sparku

Návraty

PandasOnSparkDataFrame

Poznámky

Pokud se datový rámec pandas-on-Spark převede na datový rámec Sparku a pak zpátky na pandas-on-Spark, ztratí informace o indexu a původní index se změní na normální sloupec.

Tato možnost je dostupná jenom v případě, že je knihovna Pandas nainstalovaná a dostupná.

Příklady

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob