Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Null veya NaN değerlerine sahip yeni bir DataFrame atlama satırı döndürür.
DataFrame.dropna ve DataFrameNaFunctions.drop birbirlerinin diğer adlarıdır.
Sözdizimi
dropna(how: str = "any", thresh: Optional[int] = None, subset: Optional[Union[str, Tuple[str, ...], List[str]]] = None)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
how |
str, isteğe bağlı, varsayılan 'any' | 'any' veya 'all' olabilecek değerler. 'Varsa', boş değer içeriyorsa bir satır bırakın. 'tümü' ise, yalnızca tüm değerleri null ise bir satır bırakın. |
thresh |
int, isteğe bağlı, varsayılan Yok | Belirtilirse, null olmayan değerlerden thresh az olan satırları bırakın. Bu, parametresinin how üzerine yazar. |
subset |
str, tanımlama grubu veya liste, isteğe bağlı | göz önünde bulundurulacak sütun adlarının isteğe bağlı listesi. |
İadeler
DataFrame: Yalnızca null satırlar hariç tutulan DataFrame.
Örnekler
from pyspark.sql import Row
df = spark.createDataFrame([
Row(age=10, height=80.0, name="Alice"),
Row(age=5, height=float("nan"), name="Bob"),
Row(age=None, height=None, name="Tom"),
Row(age=None, height=float("nan"), name=None),
])
df.na.drop().show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10| 80.0|Alice|
# +---+------+-----+
df.na.drop(how='all').show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# | 10| 80.0|Alice|
# | 5| NaN| Bob|
# |NULL| NULL| Tom|
# +----+------+-----+
df.na.drop(thresh=2).show()
# +---+------+-----+
# |age|height| name|
# +---+------+-----+
# | 10| 80.0|Alice|
# | 5| NaN| Bob|
# +---+------+-----+