Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Devuelve un nuevo dataframe que los valores NULL se rellenan con un nuevo valor.
DataFrame.fillna y DataFrameNaFunctions.fill son alias entre sí.
Sintaxis
fillna(value: Union["LiteralType", Dict[str, "LiteralType"]], subset: Optional[Union[str, Tuple[str, ...], List[str]]] = None)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
value |
int, float, string, bool o dict | valor por el que se van a reemplazar los valores NULL. Si el valor es un dict, subset se omite y value debe ser una asignación del nombre de columna (cadena) al valor de reemplazo. El valor de reemplazo debe ser int, float, boolean o string. |
subset |
str, tupla o lista, opcional | lista opcional de nombres de columna que se deben tener en cuenta. Se omiten las columnas especificadas en el subconjunto que no tienen tipos de datos coincidentes. |
Devoluciones
DataFrame: DataFrame con valores NULL reemplazados.
Ejemplos
df = spark.createDataFrame([
(10, 80.5, "Alice", None),
(5, None, "Bob", None),
(None, None, "Tom", None),
(None, None, None, True)],
schema=["age", "height", "name", "bool"])
df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| 50.0| Bob|NULL|
# | 50| 50.0| Tom|NULL|
# | 50| 50.0| NULL|true|
# +---+------+-----+----+
df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# | 10| 80.5|Alice|false|
# | 5| NULL| Bob|false|
# |NULL| NULL| Tom|false|
# |NULL| NULL| NULL| true|
# +----+------+-----+-----+
df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height| name|bool|
# +---+------+-------+----+
# | 10| 80.5| Alice|NULL|
# | 5| NULL| Bob|NULL|
# | 50| NULL| Tom|NULL|
# | 50| NULL|unknown|true|
# +---+------+-------+----+