Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnerar True när de logiska frågeplanerna i båda DataFrames är lika och därför returnerar samma resultat.
Syntax
sameSemantics(other: "DataFrame")
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
other |
DataFrame | Den andra DataFrame att jämföra med. |
Retur
bool: Om dessa två DataFrames är liknande.
Notes
Likhetsjämförelsen här förenklas genom att tolerera de kosmetiska skillnaderna, till exempel attributnamn.
Det här API:et kan jämföra båda DataFrames mycket snabbt men kan fortfarande returneras False på dataramar som returnerar samma resultat, till exempel från olika planer. Sådan falsk negativ semantik kan vara användbar vid cachelagring som exempel.
Det här API:et är ett utvecklar-API.
Exempel
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True