dropna

Null veya NaN değerlerine sahip yeni bir DataFrame atlama satırı döndürür. DataFrame.dropna ve DataFrameNaFunctions.drop birbirlerinin diğer adlarıdır.

Sözdizimi

dropna(how: str = "any", thresh: Optional[int] = None, subset: Optional[Union[str, Tuple[str, ...], List[str]]] = None)

Parametreler

Parametre Türü Açıklama
how str, isteğe bağlı, varsayılan 'any' 'any' veya 'all' olabilecek değerler. 'Varsa', boş değer içeriyorsa bir satır bırakın. 'tümü' ise, yalnızca tüm değerleri null ise bir satır bırakın.
thresh int, isteğe bağlı, varsayılan Yok Belirtilirse, null olmayan değerlerden thresh az olan satırları bırakın. Bu, parametresinin how üzerine yazar.
subset str, tanımlama grubu veya liste, isteğe bağlı göz önünde bulundurulacak sütun adlarının isteğe bağlı listesi.

İadeler

DataFrame: Yalnızca null satırlar hariç tutulan DataFrame.

Örnekler

from pyspark.sql import Row
df = spark.createDataFrame([
    Row(age=10, height=80.0, name="Alice"),
    Row(age=5, height=float("nan"), name="Bob"),
    Row(age=None, height=None, name="Tom"),
    Row(age=None, height=float("nan"), name=None),
])

df.na.drop().show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10|  80.0|Alice|
# +---+------+-----+

df.na.drop(how='all').show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# |  10|  80.0|Alice|
# |   5|   NaN|  Bob|
# |NULL|  NULL|  Tom|
# +----+------+-----+

df.na.drop(thresh=2).show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10|  80.0|Alice|
# |  5|   NaN|  Bob|
# +---+------+-----+