Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Devuelve un nuevo DataFrame sin columnas especificadas. Se trata de un no-op si el esquema no contiene los nombres de columna especificados.
Sintaxis
drop(*cols: "ColumnOrName")
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
cols |
str o columna | Nombre de la columna o Columna que se va a quitar. |
Devoluciones
DataFrame: un nuevo DataFrame sin las columnas especificadas.
Notas
Cuando una entrada es un nombre de columna, se trata literalmente sin una interpretación adicional. De lo contrario, intentará coincidir con la expresión equivalente. Por lo tanto, quitar una columna por su nombre drop(colName) tiene una semántica diferente con quitar directamente la columna drop(col(colName)).
Ejemplos
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+