unión

Devuelve un nuevo DataFrame que contiene la unión de filas en este y otro DataFrame.

Sintaxis

union(other: "DataFrame")

Parámetros

Parámetro	Tipo	Descripción
`other`	DataFrame	Otro dataFrame que debe estar unido.

Devoluciones

DataFrame: nuevo DataFrame que contiene las filas combinadas con las columnas correspondientes.

Notas

Este método realiza una unión de conjuntos de estilo SQL de las filas de ambos DataFrame objetos, sin desduplicación automática de elementos.

Use el distinct() método para realizar la desduplicación de filas.

El método resuelve las columnas por posición (no por nombre), siguiendo el comportamiento estándar en SQL.

Ejemplos

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

Comentaris

Us ha resultat útil aquesta pàgina?

Last updated on 2026-04-19