zKolumną

Zwraca nową ramkę danych, dodając kolumnę lub zastępując istniejącą kolumnę o tej samej nazwie.

Składnia

withColumn(colName: str, col: Column)

Parametry

Parameter Typ Opis
colName str ciąg, nazwa nowej kolumny.
col Kolumna wyrażenie kolumny dla nowej kolumny.

Zwroty

DataFrame: Ramka danych z nową lub zastąpioną kolumną.

Notatki

Ta metoda wprowadza projekcję wewnętrznie. Dlatego wywołanie go wiele razy, na przykład, za pośrednictwem pętli w celu dodania wielu kolumn może wygenerować duże plany, które mogą powodować problemy z wydajnością, a nawet StackOverflowException. Aby tego uniknąć, należy użyć z select wieloma kolumnami jednocześnie.

Examples

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# |  2|Alice|   4|
# |  5|  Bob|   7|
# +---+-----+----+