Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Null değerlerin yeni DataFrame bir değerle doldurulduğu yeni bir değer döndürür.
DataFrame.fillna ve DataFrameNaFunctions.fill birbirlerinin diğer adlarıdır.
Sözdizimi
fill(value, subset=None)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
value |
int, float, str, bool veya dict | Null değerlerin değiştirilmeye değer. Bir dikte sağlanmışsa yoksayılır subset ve value sütun adından değiştirme değerine eşleme olmalıdır. Değiştirme değerleri int, float, bool veya str olmalıdır. |
subset |
str, tanımlama grubu veya liste, isteğe bağlı | Dikkate alınması gereken sütun adları. için subset eşleşen veri türü value olmayan sütunlar yoksayılır. |
İadeler
DataFrame
Örnekler
df = spark.createDataFrame([
(10, 80.5, "Alice", None),
(5, None, "Bob", None),
(None, None, "Tom", None),
(None, None, None, True)],
schema=["age", "height", "name", "bool"])
Tüm null değerleri sayısal sütunlar için 50 ile doldurun.
df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| 50.0| Bob|NULL|
# | 50| 50.0| Tom|NULL|
# | 50| 50.0| NULL|true|
# +---+------+-----+----+
Boole sütunları için tüm null değerleri ile False doldurun.
df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# | 10| 80.5|Alice|false|
# | 5| NULL| Bob|false|
# |NULL| NULL| Tom|false|
# |NULL| NULL| NULL| true|
# +----+------+-----+-----+
için ve age"unknown"için name null değerleri 50 ile doldurun.
df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height| name|bool|
# +---+------+-------+----+
# | 10| 80.5| Alice|NULL|
# | 5| NULL| Bob|NULL|
# | 50| NULL| Tom|NULL|
# | 50| NULL|unknown|true|
# +---+------+-------+----+
Sütun için "Spark" tüm null değerleri ile name doldurun.
df.na.fill(value='Spark', subset='name').show()
# +----+------+-----+----+
# | age|height| name|bool|
# +----+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| NULL| Bob|NULL|
# |NULL| NULL| Tom|NULL|
# |NULL| NULL|Spark|true|
# +----+------+-----+----+