True 두 DataFrame 내의 논리 쿼리 계획이 같은 경우를 반환하므로 동일한 결과를 반환합니다.
문법
sameSemantics(other: "DataFrame")
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
other |
DataFrame | 비교할 다른 데이터 프레임입니다. |
Returns
bool: 이 두 데이터 프레임이 비슷한지 여부입니다.
Notes
여기서 같음 비교는 특성 이름과 같은 외관적 차이를 용인하여 간소화됩니다.
이 API는 두 DataFrame을 매우 빠르게 비교할 수 있지만 동일한 결과(예: 다른 계획)를 반환하는 DataFrames에서 여전히 반환 False 할 수 있습니다. 이러한 가음성 의미 체계는 예제로 캐싱할 때 유용할 수 있습니다.
이 API는 개발자 API입니다.
예제
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True