값을 다른 값으로 바꾸는 새 DataFrame을 반환합니다.
DataFrame.replace 는 DataFrameNaFunctions.replace 서로의 별칭입니다. to_replace 값과 값의 형식은 동일해야 하며 숫자, 부울 또는 문자열만 될 수 있습니다. 값에는 None이 있을 수 있습니다. 바꿀 때 새 값은 기존 열의 형식으로 캐스팅됩니다.
문법
replace(to_replace: Union["LiteralType", List["LiteralType"], Dict["LiteralType", "OptionalPrimitiveType"]], value: Optional[Union["OptionalPrimitiveType", List["OptionalPrimitiveType"]]] = _NoValue, subset: Optional[List[str]] = None)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
to_replace |
bool, int, float, string, list 또는 dict | 바꿀 값입니다. 값이 받아쓰 value 기인 경우 무시되거나 생략할 수 있으며 값과 to_replace 대체 값 간의 매핑이어야 합니다. |
value |
bool, int, float, string 또는 None, 선택 사항 | 대체 값은 bool, int, float, string 또는 None이어야 합니다. 목록 value 인 경우 value 길이와 형식이 같to_replace아야 합니다. 스칼라이고 value 시퀀스 to_replacevalue 인 경우 to_replace . |
subset |
list, optional | 고려할 열 이름의 선택적 목록입니다. 일치하는 데이터 형식이 없는 하위 집합에 지정된 열은 무시됩니다. |
Returns
DataFrame: 대체된 값이 있는 DataFrame입니다.
예제
df = spark.createDataFrame([
(10, 80, "Alice"),
(5, None, "Bob"),
(None, 10, "Tom"),
(None, None, None)],
schema=["age", "height", "name"])
df.na.replace(10, 20).show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# | 20| 80|Alice|
# | 5| NULL| Bob|
# |NULL| 20| Tom|
# |NULL| NULL| NULL|
# +----+------+-----+
df.na.replace('Alice', None).show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80|NULL|
# | 5| NULL| Bob|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+
df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80| A|
# | 5| NULL| B|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+