Bagikan melalui


first_value

Mengembalikan nilai pertama dari col untuk sekelompok baris. Ini akan mengembalikan nilai non-null pertama yang dilihatnya ketika ignoreNulls diatur ke true. Jika semua nilai null, maka null dikembalikan.

Syntax

from pyspark.sql import functions as sf

sf.first_value(col, ignoreNulls=None)

Parameter-parameternya

Pengaturan Tipe Description
col pyspark.sql.Column atau str Kolom target untuk dikerjakan.
ignoreNulls pyspark.sql.Column atau bool, opsional Jika nilai pertama null, maka cari nilai non-null pertama.

Pengembalian Barang

pyspark.sql.Column: beberapa nilai col untuk sekelompok baris.

Examples

Contoh 1: Dapatkan nilai pertama tanpa mengabaikan null

from pyspark.sql import functions as sf
spark.createDataFrame(
    [(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["a", "b"]
).select(sf.first_value('a'), sf.first_value('b')).show()
+--------------+--------------+
|first_value(a)|first_value(b)|
+--------------+--------------+
|          NULL|             1|
+--------------+--------------+

Contoh 2: Dapatkan nilai pertama yang mengabaikan null

from pyspark.sql import functions as sf
spark.createDataFrame(
    [(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["a", "b"]
).select(sf.first_value('a', True), sf.first_value('b', True)).show()
+--------------+--------------+
|first_value(a)|first_value(b)|
+--------------+--------------+
|             a|             1|
+--------------+--------------+