Bagikan melalui


first

Mengembalikan nilai pertama dalam grup. Fungsi secara default mengembalikan nilai pertama yang dilihatnya. Ini akan mengembalikan nilai non-null pertama yang dilihatnya ketika ignoreNulls diatur ke true. Jika semua nilai null, maka null dikembalikan. Fungsi ini tidak deterministik karena hasilnya tergantung pada urutan baris yang mungkin tidak deterministik setelah acak.

Syntax

from pyspark.sql import functions as sf

sf.first(col, ignorenulls=False)

Parameter-parameternya

Pengaturan Tipe Description
col pyspark.sql.Column atau nama kolom Kolom untuk mengambil nilai pertama.
ignorenulls bool Jika nilai pertama null, maka cari nilai non-null pertama. Salah secara default.

Pengembalian Barang

pyspark.sql.Column: nilai pertama grup.

Examples

from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5), ("Alice", None)], ("name", "age"))
df = df.orderBy(df.age)
df.groupby("name").agg(sf.first("age")).orderBy("name").show()
+-----+----------+
| name|first(age)|
+-----+----------+
|Alice|      NULL|
|  Bob|         5|
+-----+----------+

Untuk mengabaikan nilai null, atur ignorenulls ke True:

df.groupby("name").agg(sf.first("age", ignorenulls=True)).orderBy("name").show()
+-----+----------+
| name|first(age)|
+-----+----------+
|Alice|         2|
|  Bob|         5|
+-----+----------+