Udostępnij przez


first_value

Zwraca pierwszą wartość col dla grupy wierszy. Zwróci pierwszą wartość inną niż null, która zostanie wyświetlona, gdy ignoreNulls zostanie ustawiona wartość true. Jeśli wszystkie wartości mają wartość null, zwracana jest wartość null.

Składnia

from pyspark.sql import functions as sf

sf.first_value(col, ignoreNulls=None)

Parametry

Parameter Typ Description
col pyspark.sql.Column lub str Kolumna docelowa do pracy.
ignoreNulls pyspark.sql.Column lub wartość logiczna, opcjonalnie Jeśli pierwsza wartość ma wartość null, poszukaj pierwszej wartości innej niż null.

Zwraca

pyspark.sql.Column: niektóre wartości col dla grupy wierszy.

Przykłady

Przykład 1. Pobieranie pierwszej wartości bez ignorowania wartości null

from pyspark.sql import functions as sf
spark.createDataFrame(
    [(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["a", "b"]
).select(sf.first_value('a'), sf.first_value('b')).show()
+--------------+--------------+
|first_value(a)|first_value(b)|
+--------------+--------------+
|          NULL|             1|
+--------------+--------------+

Przykład 2. Pobieranie pierwszej wartości ignorując wartości null

from pyspark.sql import functions as sf
spark.createDataFrame(
    [(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["a", "b"]
).select(sf.first_value('a', True), sf.first_value('b', True)).show()
+--------------+--------------+
|first_value(a)|first_value(b)|
+--------------+--------------+
|             a|             1|
+--------------+--------------+