Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan nilai baru DataFrame di mana nilai null diisi dengan nilai baru.
DataFrame.fillna dan DataFrameNaFunctions.fill adalah alias satu sama lain.
Sintaksis
fill(value, subset=None)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
value |
int, float, str, bool, atau dict | Nilai untuk mengganti nilai null dengan. Jika dict disediakan, subset diabaikan dan value harus berupa pemetaan dari nama kolom ke nilai penggantian. Nilai penggantian harus int, float, bool, atau str. |
subset |
str, tuple, atau daftar, opsional | Nama kolom yang perlu dipertimbangkan. Kolom di subset yang tidak memiliki tipe data yang cocok untuk value diabaikan. |
Pengembalian Barang
DataFrame
Examples
df = spark.createDataFrame([
(10, 80.5, "Alice", None),
(5, None, "Bob", None),
(None, None, "Tom", None),
(None, None, None, True)],
schema=["age", "height", "name", "bool"])
Isi semua nilai null dengan 50 untuk kolom numerik.
df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| 50.0| Bob|NULL|
# | 50| 50.0| Tom|NULL|
# | 50| 50.0| NULL|true|
# +---+------+-----+----+
Isi semua nilai null dengan False untuk kolom boolean.
df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# | 10| 80.5|Alice|false|
# | 5| NULL| Bob|false|
# |NULL| NULL| Tom|false|
# |NULL| NULL| NULL| true|
# +----+------+-----+-----+
Isi nilai null dengan 50 untuk age dan "unknown" untuk name.
df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height| name|bool|
# +---+------+-------+----+
# | 10| 80.5| Alice|NULL|
# | 5| NULL| Bob|NULL|
# | 50| NULL| Tom|NULL|
# | 50| NULL|unknown|true|
# +---+------+-------+----+
Isi semua nilai null dengan "Spark" untuk name kolom.
df.na.fill(value='Spark', subset='name').show()
# +----+------+-----+----+
# | age|height| name|bool|
# +----+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| NULL| Bob|NULL|
# |NULL| NULL| Tom|NULL|
# |NULL| NULL|Spark|true|
# +----+------+-----+----+