drop (DataFrameNaFunctions)

Mengembalikan baris penghilangan baru DataFrame dengan nilai null atau NaN. DataFrame.dropna dan DataFrameNaFunctions.drop adalah alias satu sama lain.

Sintaksis

drop(how='any', thresh=None, subset=None)

Parameter-parameternya

Parameter Tipe Deskripsi
how str, opsional Apakah akan menjatuhkan baris jika berisi null atau hanya jika semua nilainya null. Nilai yang diterima adalah 'any' (default) dan 'all'. Jika thresh ditentukan, how diabaikan.
thresh int, opsional Jika ditentukan, letakkan baris yang memiliki kurang dari thresh nilai non-null. howMenimpa .
subset str, tuple, atau daftar, opsional Nama kolom yang perlu dipertimbangkan saat memeriksa nilai null atau NaN.

Pengembalian Barang

DataFrame

Examples

from pyspark.sql import Row
df = spark.createDataFrame([
    Row(age=10, height=80.0, name="Alice"),
    Row(age=5, height=float("nan"), name="Bob"),
    Row(age=None, height=None, name="Tom"),
    Row(age=None, height=float("nan"), name=None),
])

Jatuhkan baris jika berisi nilai null atau NaN.

df.na.drop().show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10|  80.0|Alice|
# +---+------+-----+

Letakkan baris hanya jika semua nilainya null atau NaN.

df.na.drop(how='all').show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# |  10|  80.0|Alice|
# |   5|   NaN|  Bob|
# |NULL|  NULL|  Tom|
# +----+------+-----+

Jatuhkan baris yang memiliki kurang dari thresh nilai non-null dan non-NaN.

df.na.drop(thresh=2).show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10|  80.0|Alice|
# |  5|   NaN|  Bob|
# +---+------+-----+

Jatuhkan baris dengan nilai null dan NaN di kolom yang ditentukan.

df.na.drop(subset=['age', 'name']).show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10|  80.0|Alice|
# |  5|   NaN|  Bob|
# +---+------+-----+