union

Mengembalikan DataFrame baru yang berisi penyatuan baris dalam ini dan DataFrame lainnya.

Sintaksis

union(other: "DataFrame")

Parameter-parameternya

Parameter Tipe Deskripsi
other DataFrame DataFrame lain yang perlu disatukan.

Pengembalian Barang

DataFrame: DataFrame baru yang berisi baris gabungan dengan kolom yang sesuai.

Catatan

Metode ini melakukan penyatuan set gaya SQL dari baris dari kedua DataFrame objek, tanpa deduplikasi elemen otomatis.

distinct() Gunakan metode untuk melakukan deduplikasi baris.

Metode ini menyelesaikan kolom berdasarkan posisi (bukan berdasarkan nama), mengikuti perilaku standar di SQL.

Examples

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+