csere (DataFrame)

Egy új DataFrame-et ad vissza, amely egy értéket egy másik értékre cserél. DataFrame.replace és DataFrameNaFunctions.replace egymás aliasai. Az to_replace és az értéknek azonos típusúnak kell lennie, és csak numerikus, logikai vagy sztring lehet. Az érték nem lehet. Csere esetén az új érték a meglévő oszlop típusára lesz vetve.

Szemantika

replace(to_replace: Union["LiteralType", List["LiteralType"], Dict["LiteralType", "OptionalPrimitiveType"]], value: Optional[Union["OptionalPrimitiveType", List["OptionalPrimitiveType"]]] = _NoValue, subset: Optional[List[str]] = None)

Paraméterek

Paraméter Típus Leírás
to_replace bool, int, float, string, list or dict a lecserélendő érték. Ha az érték egy diktálás, akkor value figyelmen kívül hagyható vagy kihagyható, és to_replace egy érték és egy csere közötti megfeleltetésnek kell lennie.
value bool, int, float, string or None, optional A csereértéknek boolnak, intnek, lebegőpontosnak, sztringnek vagy Nincs értéknek kell lennie. Ha value lista, value akkor a hosszúsága és a típusa megegyezik a to_replacekövetkezővel: Ha value skaláris, és to_replace szekvenciát jelent, akkor value a rendszer az egyes elemek helyére kerül.to_replace
subset lista, nem kötelező a megfontolandó oszlopnevek választható listája. Az olyan részhalmazban megadott oszlopok, amelyek nem rendelkeznek egyező adattípusokkal, figyelmen kívül lesznek hagyva.

Visszatérítések

DataFrame: DataFrame lecserélt értékekkel.

Examples

df = spark.createDataFrame([
    (10, 80, "Alice"),
    (5, None, "Bob"),
    (None, 10, "Tom"),
    (None, None, None)],
    schema=["age", "height", "name"])

df.na.replace(10, 20).show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# |  20|    80|Alice|
# |   5|  NULL|  Bob|
# |NULL|    20|  Tom|
# |NULL|  NULL| NULL|
# +----+------+-----+

df.na.replace('Alice', None).show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# |  10|    80|NULL|
# |   5|  NULL| Bob|
# |NULL|    10| Tom|
# |NULL|  NULL|NULL|
# +----+------+----+

df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# |  10|    80|   A|
# |   5|  NULL|   B|
# |NULL|    10| Tom|
# |NULL|  NULL|NULL|
# +----+------+----+