Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan baris DataFrame baru yang menghilangkan baris dengan nilai null atau NaN.
DataFrame.dropna dan DataFrameNaFunctions.drop adalah alias satu sama lain.
Sintaksis
dropna(how: str = "any", thresh: Optional[int] = None, subset: Optional[Union[str, Tuple[str, ...], List[str]]] = None)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
how |
str, opsional, default 'any' | nilai yang dapat berupa 'apa pun' atau 'semua'. Jika 'ada', letakkan baris jika berisi null. Jika 'semua', letakkan baris hanya jika semua nilainya null. |
thresh |
int, opsional, default Tidak Ada | Jika ditentukan, letakkan baris yang memiliki nilai kurang dari thresh non-null. Ini menimpa how parameter. |
subset |
str, tuple, atau daftar, opsional | daftar opsional nama kolom yang perlu dipertimbangkan. |
Pengembalian Barang
DataFrame: DataFrame dengan baris null saja yang dikecualikan.
Examples
from pyspark.sql import Row
df = spark.createDataFrame([
Row(age=10, height=80.0, name="Alice"),
Row(age=5, height=float("nan"), name="Bob"),
Row(age=None, height=None, name="Tom"),
Row(age=None, height=float("nan"), name=None),
])
df.na.drop().show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10| 80.0|Alice|
# +---+------+-----+
df.na.drop(how='all').show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# | 10| 80.0|Alice|
# | 5| NaN| Bob|
# |NULL| NULL| Tom|
# +----+------+-----+
df.na.drop(thresh=2).show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10| 80.0|Alice|
# | 5| NaN| Bob|
# +---+------+-----+