Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan DataFrame baru yang berisi penyatuan baris dalam ini dan DataFrame lainnya.
Sintaksis
union(other: "DataFrame")
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
other |
DataFrame | DataFrame lain yang perlu disatukan. |
Pengembalian Barang
DataFrame: DataFrame baru yang berisi baris gabungan dengan kolom yang sesuai.
Catatan
Metode ini melakukan penyatuan set gaya SQL dari baris dari kedua DataFrame objek, tanpa deduplikasi elemen otomatis.
distinct() Gunakan metode untuk melakukan deduplikasi baris.
Metode ini menyelesaikan kolom berdasarkan posisi (bukan berdasarkan nama), mengikuti perilaku standar di SQL.
Examples
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+
df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+