체크포인트

이 DataFrame의 검사점이 지정된 버전을 반환합니다. 검사점을 사용하여 이 DataFrame의 논리적 계획을 잘라낼 수 있습니다. 이는 계획이 기하급수적으로 증가할 수 있는 반복 알고리즘에서 특히 유용합니다. 구성을 사용하여 검사점 디렉터리 집합 SparkContext.setCheckpointDirspark.checkpoint.dir 내의 파일에 저장됩니다.

문법

checkpoint(eager: bool = True)

매개 변수

매개 변수 유형 설명
eager bool, 선택 사항, 기본 True 이 DataFrame의 검사점을 즉시 검사할지 여부입니다.

Returns

DataFrame: 검사점이 있는 데이터 프레임입니다.

Notes

이 API는 실험적입니다.

예제

df = spark.createDataFrame([
    (14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.checkpoint(False)
# DataFrame[age: bigint, name: string]