cache

Zachová datový rámec s výchozí úrovní úložiště (MEMORY_AND_DISK_DESER).

Syntaxe

cache()

Návraty

DataFrame: Datový rámec uložený v mezipaměti.

Poznámky

Výchozí úroveň úložiště se změnila tak, aby MEMORY_AND_DISK_DESER odpovídala Scala ve verzi 3.0.

Data uložená v mezipaměti se sdílí napříč všemi relacemi Sparku v clusteru.

Příklady

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...