withColumn

열을 추가하거나 이름이 같은 기존 열을 바꿔 새 DataFrame을 반환합니다.

문법

withColumn(colName: str, col: Column)

매개 변수

매개 변수 유형 설명
colName str 문자열, 새 열의 이름입니다.
col 칼럼 새 열에 대한 열 식입니다.

Returns

DataFrame: 새 열 또는 바뀐 열이 있는 데이터 프레임입니다.

Notes

이 메서드는 내부적으로 프로젝션을 도입합니다. 따라서 예를 들어 여러 열을 추가하기 위해 루프를 통해 여러 번 호출하면 성능 문제 및 심지어 StackOverflowException큰 계획을 생성할 수 있습니다. 이를 방지하려면 한 번에 여러 열과 함께 사용합니다 select .

예제

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# |  2|Alice|   4|
# |  5|  Bob|   7|
# +---+-----+----+