unionByName

Mengembalikan DataFrame baru yang berisi penyatuan baris dalam ini dan DataFrame lainnya.

Sintaksis

unionByName(other: "DataFrame", allowMissingColumns: bool = False)

Parameter-parameternya

Parameter Tipe Deskripsi
other DataFrame DataFrame lain yang perlu digabungkan.
allowMissingColumns bool, opsional, default False Tentukan apakah akan memperbolehkan kolom yang hilang.

Pengembalian Barang

DataFrame: DataFrame baru yang berisi baris gabungan dengan kolom terkait dari dua DataFrame yang diberikan.

Catatan

Metode ini melakukan operasi penyatuan pada kedua DataFrames input, menyelesaikan kolom berdasarkan nama (bukan posisi). Ketika allowMissingColumns True, kolom yang hilang akan diisi dengan null.

Examples

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col0"])
df1.unionByName(df2).show()
# +----+----+----+
# |col0|col1|col2|
# +----+----+----+
# |   1|   2|   3|
# |   6|   4|   5|
# +----+----+----+

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col3"])
df1.unionByName(df2, allowMissingColumns=True).show()
# +----+----+----+----+
# |col0|col1|col2|col3|
# +----+----+----+----+
# |   1|   2|   3|NULL|
# |NULL|   4|   5|   6|
# +----+----+----+----+