unionByName

Returnerar en ny DataFrame som innehåller en union av rader i den här och en annan DataFrame.

Syntax

unionByName(other: "DataFrame", allowMissingColumns: bool = False)

Parameters

Parameter Type Beskrivning
other DataFrame En annan DataFrame som måste kombineras.
allowMissingColumns bool, valfritt, standard falskt Ange om kolumner som saknas ska tillåtas.

Retur

DataFrame: En ny DataFrame som innehåller de kombinerade raderna med motsvarande kolumner i de två angivna DataFrames.

Notes

Den här metoden utför en union-åtgärd på båda indatadataramarna och löser kolumner efter namn (i stället för position). När allowMissingColumns är Sant fylls saknade kolumner med null.

Exempel

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col0"])
df1.unionByName(df2).show()
# +----+----+----+
# |col0|col1|col2|
# +----+----+----+
# |   1|   2|   3|
# |   6|   4|   5|
# +----+----+----+

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col3"])
df1.unionByName(df2, allowMissingColumns=True).show()
# +----+----+----+----+
# |col0|col1|col2|col3|
# +----+----+----+----+
# |   1|   2|   3|NULL|
# |NULL|   4|   5|   6|
# +----+----+----+----+