Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Zwraca nową ramkę danych, dodając kolumnę lub zastępując istniejącą kolumnę o tej samej nazwie.
Składnia
withColumn(colName: str, col: Column)
Parametry
| Parameter | Typ | Opis |
|---|---|---|
colName |
str | ciąg, nazwa nowej kolumny. |
col |
Kolumna | wyrażenie kolumny dla nowej kolumny. |
Zwroty
DataFrame: Ramka danych z nową lub zastąpioną kolumną.
Notatki
Ta metoda wprowadza projekcję wewnętrznie. Dlatego wywołanie go wiele razy, na przykład, za pośrednictwem pętli w celu dodania wielu kolumn może wygenerować duże plany, które mogą powodować problemy z wydajnością, a nawet StackOverflowException. Aby tego uniknąć, należy użyć z select wieloma kolumnami jednocześnie.
Examples
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+