drop (DataFrameNaFunctions)

Null veya NaN değerlerine sahip yeni DataFrame bir atlama satırı döndürür. DataFrame.dropna ve DataFrameNaFunctions.drop birbirlerinin diğer adlarıdır.

Sözdizimi

drop(how='any', thresh=None, subset=None)

Parametreler

Parametre Türü Açıklama
how str, isteğe bağlı Bir satırın null değer içermesi veya yalnızca tüm değerlerinin null olması durumunda bırakılıp bırakılmayacağı. Kabul edilen değerler (varsayılan) ve 'any'değerleridir 'all' . belirtilirse thresh yoksayılır how .
thresh int, isteğe bağlı Belirtilirse, null olmayan değerlerden thresh daha az değer içeren satırları bırakın. üzerine yazar how.
subset str, tanımlama grubu veya liste, isteğe bağlı Null veya NaN değerleri denetlenirken dikkate alınacak sütun adları.

İadeler

DataFrame

Örnekler

from pyspark.sql import Row
df = spark.createDataFrame([
    Row(age=10, height=80.0, name="Alice"),
    Row(age=5, height=float("nan"), name="Bob"),
    Row(age=None, height=None, name="Tom"),
    Row(age=None, height=float("nan"), name=None),
])

Null veya NaN değeri içeriyorsa satırı bırakın.

df.na.drop().show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10|  80.0|Alice|
# +---+------+-----+

Satırı yalnızca tüm değerleri null veya NaN ise bırakın.

df.na.drop(how='all').show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# |  10|  80.0|Alice|
# |   5|   NaN|  Bob|
# |NULL|  NULL|  Tom|
# +----+------+-----+

Null olmayan ve NaN olmayan değerlerden thresh daha az olan satırları bırakın.

df.na.drop(thresh=2).show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10|  80.0|Alice|
# |  5|   NaN|  Bob|
# +---+------+-----+

Belirtilen sütunlarda null ve NaN değerlerine sahip satırları bırakın.

df.na.drop(subset=['age', 'name']).show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10|  80.0|Alice|
# |  5|   NaN|  Bob|
# +---+------+-----+