pandas_api

Преобразует существующий кадр данных в кадр данных pandas-on-Spark.

Синтаксис

pandas_api(index_col: Optional[Union[str, List[str]]] = None)

Параметры

Параметр Тип Описание
index_col str или list of str, необязательный Индексировать столбец таблицы в Spark.

Возвраты

PandasOnSparkDataFrame

Примечания

Если кадр данных Pandas-on-Spark преобразуется в кадр данных Spark, а затем обратно в pandas-on-Spark, он потеряет сведения об индексе, а исходный индекс будет преобразован в обычный столбец.

Это доступно только в том случае, если Pandas установлен и доступен.

Примеры

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])

df.pandas_api()
#    age   name
# 0   14    Tom
# 1   23  Alice
# 2   16    Bob

df.pandas_api(index_col="age")
#       name
# age
# 14     Tom
# 23   Alice
# 16     Bob