Teilen über


any_value

Gibt einen beliebigen Wert der Spalte für eine Gruppe von Zeilen zurück.

Syntax

from pyspark.sql import functions as sf

sf.any_value(col, ignoreNulls=None)

Die Parameter

Parameter Typ Description
col pyspark.sql.Column oder Spaltenname Zielspalte, an der gearbeitet werden soll.
ignoreNulls pyspark.sql.Column oder Bool, optional Wenn der erste Wert null ist, suchen Sie nach dem ersten Wert ungleich Null.

Rückkehr

pyspark.sql.Column: ein Wert col für eine Gruppe von Zeilen.

Examples

from pyspark.sql import functions as sf
df = spark.createDataFrame(
    [(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
df.select(sf.any_value('c1'), sf.any_value('c2')).show()
+-------------+-------------+
|any_value(c1)|any_value(c2)|
+-------------+-------------+
|         NULL|            1|
+-------------+-------------+
df.select(sf.any_value('c1', True), sf.any_value('c2', True)).show()
+-------------+-------------+
|any_value(c1)|any_value(c2)|
+-------------+-------------+
|            a|            1|
+-------------+-------------+