Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bir değeri başka bir değerle değiştiren yeni bir DataFrame döndürür.
DataFrame.replace ve DataFrameNaFunctions.replace birbirlerinin diğer adlarıdır. to_replace ve değer değerleri aynı türde olmalıdır ve yalnızca sayısal değerler, boole değerleri veya dizeler olabilir. DeğerDe Yok olabilir. Değiştirildiğinde, yeni değer var olan sütunun türüne göre değiştirilir.
Sözdizimi
replace(to_replace: Union["LiteralType", List["LiteralType"], Dict["LiteralType", "OptionalPrimitiveType"]], value: Optional[Union["OptionalPrimitiveType", List["OptionalPrimitiveType"]]] = _NoValue, subset: Optional[List[str]] = None)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
to_replace |
bool, int, float, string, list veya dict | değiştirilecek değeri seçin. Değer bir dikte ise yoksayılır value veya atlanabilir ve to_replace değer ile değiştirme arasında bir eşleme olmalıdır. |
value |
bool, int, float, string veya None, isteğe bağlı | Değiştirme değeri bool, int, float, string veya None olmalıdır. Liste ise value , value ile aynı uzunlukta ve türünde to_replaceolmalıdır. Skaler value ise ve to_replace bir diziyse, value içindeki to_replaceher öğenin yerine kullanılır. |
subset |
liste, isteğe bağlı | göz önünde bulundurulacak sütun adlarının isteğe bağlı listesi. Eşleşen veri türleri olmayan alt kümede belirtilen sütunlar yoksayılır. |
İadeler
DataFrame: Değiştirilen değerlerle DataFrame.
Örnekler
df = spark.createDataFrame([
(10, 80, "Alice"),
(5, None, "Bob"),
(None, 10, "Tom"),
(None, None, None)],
schema=["age", "height", "name"])
df.na.replace(10, 20).show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# | 20| 80|Alice|
# | 5| NULL| Bob|
# |NULL| 20| Tom|
# |NULL| NULL| NULL|
# +----+------+-----+
df.na.replace('Alice', None).show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80|NULL|
# | 5| NULL| Bob|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+
df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80| A|
# | 5| NULL| B|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+