Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Devuelve un nuevo DataFrame que contiene filas tanto en esta trama de datos como en otra trama de datos, a la vez que conserva los duplicados.
Sintaxis
intersectAll(other: "DataFrame")
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
other |
DataFrame | Otro DataFrame que debe combinarse. |
Devoluciones
DataFrame: DataFrame combinado.
Notas
Esto equivale a INTERSECT ALL en SQL. Como estándar en SQL, esta función resuelve las columnas por posición (no por nombre).
Ejemplos
df1 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3), ("c", 4)], ["C1", "C2"])
df2 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3)], ["C1", "C2"])
result_df = df1.intersectAll(df2).sort("C1", "C2")
result_df.show()
# +---+---+
# | C1| C2|
# +---+---+
# | a| 1|
# | a| 1|
# | b| 3|
# +---+---+
df1 = spark.createDataFrame([(1, "A"), (2, "B")], ["id", "value"])
df2 = spark.createDataFrame([(2, "B"), (3, "C")], ["id", "value"])
result_df = df1.intersectAll(df2).sort("id", "value")
result_df.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 2| B|
# +---+-----+