Megosztás:


első

Egy csoport első értékét adja vissza. A függvény alapértelmezés szerint az első látható értékeket adja vissza. Visszaadja az első nem null értéket, amelyet akkor lát, ha az ignoreNulls értéke igaz. Ha minden érték null, akkor a függvény null értéket ad vissza. A függvény nem determinisztikus, mert az eredmények a sorok sorrendjétől függenek, amelyek nem determinisztikusak lehetnek az elegyezés után.

Szemantika

from pyspark.sql import functions as sf

sf.first(col, ignorenulls=False)

Paraméterek

Paraméter Típus Description
col pyspark.sql.Column vagy oszlop neve Oszlop az első érték lekéréséhez.
ignorenulls bool Ha az első érték null, akkor keresse meg az első nem null értéket. Alapértelmezés szerint hamis.

Visszatérítések

pyspark.sql.Column: a csoport első értéke.

Példák

from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5), ("Alice", None)], ("name", "age"))
df = df.orderBy(df.age)
df.groupby("name").agg(sf.first("age")).orderBy("name").show()
+-----+----------+
| name|first(age)|
+-----+----------+
|Alice|      NULL|
|  Bob|         5|
+-----+----------+

A null értékek figyelmen kívül hagyásához állítsa a ignorenulls következőre True:

df.groupby("name").agg(sf.first("age", ignorenulls=True)).orderBy("name").show()
+-----+----------+
| name|first(age)|
+-----+----------+
|Alice|         2|
|  Bob|         5|
+-----+----------+