Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan DataFrame baru dengan menambahkan kolom atau mengganti kolom yang sudah ada yang memiliki nama yang sama.
Sintaksis
withColumn(colName: str, col: Column)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
colName |
str | string, nama kolom baru. |
col |
kolom | Ekspresi Kolom untuk kolom baru. |
Pengembalian Barang
DataFrame: DataFrame dengan kolom baru atau diganti.
Catatan
Metode ini memperkenalkan proyeksi secara internal. Oleh karena itu, memanggilnya beberapa kali, misalnya, melalui perulangan untuk menambahkan beberapa kolom dapat menghasilkan rencana besar yang dapat menyebabkan masalah performa dan bahkan StackOverflowException. Untuk menghindari hal ini, gunakan select dengan beberapa kolom sekaligus.
Examples
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+