Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Egy csoport első értékét adja vissza. A függvény alapértelmezés szerint az első látható értékeket adja vissza. Visszaadja az első nem null értéket, amelyet akkor lát, ha az ignoreNulls értéke igaz. Ha minden érték null, akkor a függvény null értéket ad vissza. A függvény nem determinisztikus, mert az eredmények a sorok sorrendjétől függenek, amelyek nem determinisztikusak lehetnek az elegyezés után.
Szemantika
from pyspark.sql import functions as sf
sf.first(col, ignorenulls=False)
Paraméterek
| Paraméter | Típus | Description |
|---|---|---|
col |
pyspark.sql.Column vagy oszlop neve |
Oszlop az első érték lekéréséhez. |
ignorenulls |
bool | Ha az első érték null, akkor keresse meg az első nem null értéket. Alapértelmezés szerint hamis. |
Visszatérítések
pyspark.sql.Column: a csoport első értéke.
Példák
from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5), ("Alice", None)], ("name", "age"))
df = df.orderBy(df.age)
df.groupby("name").agg(sf.first("age")).orderBy("name").show()
+-----+----------+
| name|first(age)|
+-----+----------+
|Alice| NULL|
| Bob| 5|
+-----+----------+
A null értékek figyelmen kívül hagyásához állítsa a ignorenulls következőre True:
df.groupby("name").agg(sf.first("age", ignorenulls=True)).orderBy("name").show()
+-----+----------+
| name|first(age)|
+-----+----------+
|Alice| 2|
| Bob| 5|
+-----+----------+