Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan DataFrame baru yang menggantikan nilai dengan nilai lain.
DataFrame.replace dan DataFrameNaFunctions.replace adalah alias satu sama lain. Nilai to_replace dan nilai harus memiliki jenis yang sama dan hanya dapat berupa numerik, boolean, atau string. Nilai dapat memiliki Tidak Ada. Saat mengganti, nilai baru akan ditransmisikan ke jenis kolom yang ada.
Sintaksis
replace(to_replace: Union["LiteralType", List["LiteralType"], Dict["LiteralType", "OptionalPrimitiveType"]], value: Optional[Union["OptionalPrimitiveType", List["OptionalPrimitiveType"]]] = _NoValue, subset: Optional[List[str]] = None)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
to_replace |
bool, int, float, string, list atau dict | nilai yang akan diganti. Jika nilainya adalah dict, maka value diabaikan atau dapat dihilangkan, dan to_replace harus berupa pemetaan antara nilai dan penggantian. |
value |
bool, int, float, string atau None, opsional | Nilai penggantian harus bool, int, float, string atau None. Jika value adalah daftar, value harus memiliki panjang dan jenis yang sama dengan to_replace. Jika value bersifat skalar dan to_replace merupakan urutan, maka value digunakan sebagai pengganti untuk setiap item di to_replace. |
subset |
daftar, opsional | daftar opsional nama kolom yang perlu dipertimbangkan. Kolom yang ditentukan dalam subset yang tidak memiliki jenis data yang cocok diabaikan. |
Pengembalian Barang
DataFrame: DataFrame dengan nilai yang diganti.
Examples
df = spark.createDataFrame([
(10, 80, "Alice"),
(5, None, "Bob"),
(None, 10, "Tom"),
(None, None, None)],
schema=["age", "height", "name"])
df.na.replace(10, 20).show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# | 20| 80|Alice|
# | 5| NULL| Bob|
# |NULL| 20| Tom|
# |NULL| NULL| NULL|
# +----+------+-----+
df.na.replace('Alice', None).show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80|NULL|
# | 5| NULL| Bob|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+
df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80| A|
# | 5| NULL| B|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+