ganti (DataFrame)

Mengembalikan DataFrame baru yang menggantikan nilai dengan nilai lain. DataFrame.replace dan DataFrameNaFunctions.replace adalah alias satu sama lain. Nilai to_replace dan nilai harus memiliki jenis yang sama dan hanya dapat berupa numerik, boolean, atau string. Nilai dapat memiliki Tidak Ada. Saat mengganti, nilai baru akan ditransmisikan ke jenis kolom yang ada.

Sintaksis

replace(to_replace: Union["LiteralType", List["LiteralType"], Dict["LiteralType", "OptionalPrimitiveType"]], value: Optional[Union["OptionalPrimitiveType", List["OptionalPrimitiveType"]]] = _NoValue, subset: Optional[List[str]] = None)

Parameter-parameternya

Parameter Tipe Deskripsi
to_replace bool, int, float, string, list atau dict nilai yang akan diganti. Jika nilainya adalah dict, maka value diabaikan atau dapat dihilangkan, dan to_replace harus berupa pemetaan antara nilai dan penggantian.
value bool, int, float, string atau None, opsional Nilai penggantian harus bool, int, float, string atau None. Jika value adalah daftar, value harus memiliki panjang dan jenis yang sama dengan to_replace. Jika value bersifat skalar dan to_replace merupakan urutan, maka value digunakan sebagai pengganti untuk setiap item di to_replace.
subset daftar, opsional daftar opsional nama kolom yang perlu dipertimbangkan. Kolom yang ditentukan dalam subset yang tidak memiliki jenis data yang cocok diabaikan.

Pengembalian Barang

DataFrame: DataFrame dengan nilai yang diganti.

Examples

df = spark.createDataFrame([
    (10, 80, "Alice"),
    (5, None, "Bob"),
    (None, 10, "Tom"),
    (None, None, None)],
    schema=["age", "height", "name"])

df.na.replace(10, 20).show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# |  20|    80|Alice|
# |   5|  NULL|  Bob|
# |NULL|    20|  Tom|
# |NULL|  NULL| NULL|
# +----+------+-----+

df.na.replace('Alice', None).show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# |  10|    80|NULL|
# |   5|  NULL| Bob|
# |NULL|    10| Tom|
# |NULL|  NULL|NULL|
# +----+------+----+

df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# |  10|    80|   A|
# |   5|  NULL|   B|
# |NULL|    10| Tom|
# |NULL|  NULL|NULL|
# +----+------+----+