열을 추가하거나 이름이 같은 기존 열을 바꿔 새 DataFrame을 반환합니다.
문법
withColumn(colName: str, col: Column)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
colName |
str | 문자열, 새 열의 이름입니다. |
col |
칼럼 | 새 열에 대한 열 식입니다. |
Returns
DataFrame: 새 열 또는 바뀐 열이 있는 데이터 프레임입니다.
Notes
이 메서드는 내부적으로 프로젝션을 도입합니다. 따라서 예를 들어 여러 열을 추가하기 위해 루프를 통해 여러 번 호출하면 성능 문제 및 심지어 StackOverflowException큰 계획을 생성할 수 있습니다. 이를 방지하려면 한 번에 여러 열과 함께 사용합니다 select .
예제
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+