Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Vrátí novou DataFrame hodnotu, ve které jsou hodnoty null vyplněny novou hodnotou.
DataFrame.fillna a DataFrameNaFunctions.fill jsou mezi sebou aliasy.
Syntaxe
fill(value, subset=None)
Parametry
| Parameter | Typ | Description |
|---|---|---|
value |
int, float, str, bool nebo dikt | Hodnota, která má nahradit hodnoty null. Pokud je k dispozici diktování, subset bude ignorováno a value musí se jednat o mapování z názvu sloupce na náhradní hodnotu. Náhradní hodnoty musí být int, float, bool nebo str. |
subset |
str, řazená kolekce členů nebo seznam, volitelné | Názvy sloupců, které je potřeba vzít v úvahu. Sloupce, u subset kterých není odpovídající datový typ, value se ignorují. |
Návraty
DataFrame
Příklady
df = spark.createDataFrame([
(10, 80.5, "Alice", None),
(5, None, "Bob", None),
(None, None, "Tom", None),
(None, None, None, True)],
schema=["age", "height", "name", "bool"])
Vyplňte všechny hodnoty null 50 pro číselné sloupce.
df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| 50.0| Bob|NULL|
# | 50| 50.0| Tom|NULL|
# | 50| 50.0| NULL|true|
# +---+------+-----+----+
Vyplňte všechny hodnoty False null pro logické sloupce.
df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# | 10| 80.5|Alice|false|
# | 5| NULL| Bob|false|
# |NULL| NULL| Tom|false|
# |NULL| NULL| NULL| true|
# +----+------+-----+-----+
Vyplňte hodnoty null 50 pro age a "unknown" pro name.
df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height| name|bool|
# +---+------+-------+----+
# | 10| 80.5| Alice|NULL|
# | 5| NULL| Bob|NULL|
# | 50| NULL| Tom|NULL|
# | 50| NULL|unknown|true|
# +---+------+-------+----+
Vyplňte všechny hodnoty "Spark" null pro name sloupec.
df.na.fill(value='Spark', subset='name').show()
# +----+------+-----+----+
# | age|height| name|bool|
# +----+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| NULL| Bob|NULL|
# |NULL| NULL| Tom|NULL|
# |NULL| NULL|Spark|true|
# +----+------+-----+----+