Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Fungsionalitas untuk bekerja dengan data yang hilang dalam DataFrame.
Mendukung Spark Connect
Sintaksis
DataFrame.na
Metode
| Metode | Deskripsi |
|---|---|
drop(how, thresh, subset) |
Mengembalikan baris DataFrame baru yang menghilangkan baris dengan nilai null atau NaN. |
fill(value, subset) |
Mengembalikan DataFrame baru dengan nilai null digantikan oleh nilai yang ditentukan. |
replace(to_replace, value, subset) |
Mengembalikan DataFrame baru yang menggantikan nilai dengan nilai lain. |
Examples
Hapus baris dengan nilai null
from pyspark.sql import Row
df = spark.createDataFrame([
Row(age=10, height=80.0, name="Alice"),
Row(age=5, height=None, name="Bob"),
Row(age=None, height=None, name="Tom"),
])
df.na.drop().show()
+---+------+-----+
|age|height| name|
+---+------+-----+
| 10| 80.0|Alice|
+---+------+-----+
Isi nilai null
df = spark.createDataFrame([
(10, 80.5, "Alice"),
(5, None, "Bob"),
(None, None, "Tom")],
schema=["age", "height", "name"])
df.na.fill({'age': 50, 'name': 'unknown'}).show()
+---+------+-------+
|age|height| name|
+---+------+-------+
| 10| 80.5| Alice|
| 5| NULL| Bob|
| 50| NULL|unknown|
+---+------+-------+
Ganti nilai
df = spark.createDataFrame([
(10, 80, "Alice"),
(5, None, "Bob"),
(None, 10, "Tom")],
schema=["age", "height", "name"])
df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
+----+------+----+
| age|height|name|
+----+------+----+
| 10| 80| A|
| 5| NULL| B|
|NULL| 10| Tom|
+----+------+----+