기본 스토리지 수준(MEMORY_AND_DISK_DESER)을 사용하여 DataFrame을 유지합니다.
문법
cache()
Returns
DataFrame: 캐시된 데이터 프레임입니다.
Notes
기본 스토리지 수준이 3.0의 Scala와 일치하도록 MEMORY_AND_DISK_DESER 변경되었습니다.
캐시된 데이터는 클러스터의 모든 Spark 세션에서 공유됩니다.
예제
df = spark.range(1)
df.cache()
# DataFrame[id: bigint]
df.explain()
# == Physical Plan ==
# InMemoryTableScan ...