이 DataFrame의 로컬 검사점 버전을 반환합니다. 검사점을 사용하여 이 DataFrame의 논리적 계획을 잘라낼 수 있습니다. 이는 계획이 기하급수적으로 증가할 수 있는 반복 알고리즘에서 특히 유용합니다. 로컬 검사점은 캐싱 하위 시스템을 사용하여 실행기에 저장되므로 신뢰할 수 없습니다.
문법
localCheckpoint(eager: bool = True, storageLevel: Optional[StorageLevel] = None)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
eager |
bool, 선택 사항, 기본 True | 이 DataFrame의 검사점을 즉시 검사할지 여부입니다. |
storageLevel |
StorageLevel, 선택 사항, 기본 없음 | 검사점이 저장될 StorageLevel입니다. 지정하지 않으면 기본적으로 RDD 로컬 검사점이 사용됩니다. |
Returns
DataFrame: 검사점이 있는 데이터 프레임입니다.
Notes
이 API는 실험적입니다.
예제
df = spark.createDataFrame([
(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.localCheckpoint(False)
# DataFrame[age: bigint, name: string]