Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan nilai pertama dalam grup. Fungsi secara default mengembalikan nilai pertama yang dilihatnya. Ini akan mengembalikan nilai non-null pertama yang dilihatnya ketika ignoreNulls diatur ke true. Jika semua nilai null, maka null dikembalikan. Fungsi ini tidak deterministik karena hasilnya tergantung pada urutan baris yang mungkin tidak deterministik setelah acak.
Syntax
from pyspark.sql import functions as sf
sf.first(col, ignorenulls=False)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
col |
pyspark.sql.Column atau nama kolom |
Kolom untuk mengambil nilai pertama. |
ignorenulls |
bool | Jika nilai pertama null, maka cari nilai non-null pertama. Salah secara default. |
Pengembalian Barang
pyspark.sql.Column: nilai pertama grup.
Examples
from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5), ("Alice", None)], ("name", "age"))
df = df.orderBy(df.age)
df.groupby("name").agg(sf.first("age")).orderBy("name").show()
+-----+----------+
| name|first(age)|
+-----+----------+
|Alice| NULL|
| Bob| 5|
+-----+----------+
Untuk mengabaikan nilai null, atur ignorenulls ke True:
df.groupby("name").agg(sf.first("age", ignorenulls=True)).orderBy("name").show()
+-----+----------+
| name|first(age)|
+-----+----------+
|Alice| 2|
| Bob| 5|
+-----+----------+