cache

Сохраняет кадр данных с уровнем хранилища по умолчанию (MEMORY_AND_DISK_DESER).

Синтаксис

cache()

Возвраты

DataFrame: кэшированный кадр данных.

Примечания

Уровень хранения по умолчанию изменился на MEMORY_AND_DISK_DESER соответствие Scala в версии 3.0.

Кэшированные данные используются во всех сеансах Spark в кластере.

Примеры

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...