Megosztás:


first_value

Egy sorcsoport első értékét col adja vissza. Visszaadja az első nem null értéket, amely akkor jelenik meg, ha ignoreNulls igaz értékre van állítva. Ha minden érték null, akkor a függvény null értéket ad vissza.

Szemantika

from pyspark.sql import functions as sf

sf.first_value(col, ignoreNulls=None)

Paraméterek

Paraméter Típus Description
col pyspark.sql.Column vagy str Céloszlop, amelyen dolgozni szeretne.
ignoreNulls pyspark.sql.Column vagy bool, nem kötelező Ha az első érték null, akkor keresse meg az első nem null értéket.

Visszatérítések

pyspark.sql.Column: egy sorcsoport bizonyos értéke col .

Példák

1. példa: Első érték lekérése null értékek figyelmen kívül hagyása nélkül

from pyspark.sql import functions as sf
spark.createDataFrame(
    [(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["a", "b"]
).select(sf.first_value('a'), sf.first_value('b')).show()
+--------------+--------------+
|first_value(a)|first_value(b)|
+--------------+--------------+
|          NULL|             1|
+--------------+--------------+

2. példa: Első érték lekérése null értékek figyelmen kívül hagyásával

from pyspark.sql import functions as sf
spark.createDataFrame(
    [(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["a", "b"]
).select(sf.first_value('a', True), sf.first_value('b', True)).show()
+--------------+--------------+
|first_value(a)|first_value(b)|
+--------------+--------------+
|             a|             1|
+--------------+--------------+