Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Egy csoport kifejezésének maximális értékét adja vissza. A számítás során a null értékek figyelmen kívül lesznek hagyva. A naN-értékek nagyobbak, mint bármely más numerikus érték.
Szemantika
from pyspark.sql import functions as sf
sf.max(col)
Paraméterek
| Paraméter | Típus | Description |
|---|---|---|
col |
pyspark.sql.Column vagy oszlop neve |
Az a céloszlop, amelyre a maximális érték számítva van. |
Visszatérítések
pyspark.sql.Column: A kiszámított maximális értéket tartalmazó oszlop.
Példák
1. példa: Numerikus oszlop maximális értékének kiszámítása
import pyspark.sql.functions as sf
df = spark.range(10)
df.select(sf.max(df.id)).show()
+-------+
|max(id)|
+-------+
| 9|
+-------+
2. példa: Egy sztringoszlop maximális értékének kiszámítása
import pyspark.sql.functions as sf
df = spark.createDataFrame([("A",), ("B",), ("C",)], ["value"])
df.select(sf.max(df.value)).show()
+----------+
|max(value)|
+----------+
| C|
+----------+
3. példa: Egy oszlop maximális értékének kiszámítása csoportosított Adatkeretben
import pyspark.sql.functions as sf
df = spark.createDataFrame([("A", 1), ("A", 2), ("B", 3), ("B", 4)], ["key", "value"])
df.groupBy("key").agg(sf.max(df.value)).show()
+---+----------+
|key|max(value)|
+---+----------+
| A| 2|
| B| 4|
+---+----------+
4. példa: Több oszlop maximális értékének kiszámítása csoportosított Adatkeretben
import pyspark.sql.functions as sf
df = spark.createDataFrame(
[("A", 1, 2), ("A", 2, 3), ("B", 3, 4), ("B", 4, 5)], ["key", "value1", "value2"])
df.groupBy("key").agg(sf.max("value1"), sf.max("value2")).show()
+---+-----------+-----------+
|key|max(value1)|max(value2)|
+---+-----------+-----------+
| A| 2| 3|
| B| 4| 5|
+---+-----------+-----------+
5. példa: Null értékekkel rendelkező oszlop maximális értékének kiszámítása
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1,), (2,), (None,)], ["value"])
df.select(sf.max(df.value)).show()
+----------+
|max(value)|
+----------+
| 2|
+----------+
6. példa: Egy oszlop maximális értékének kiszámítása "NaN" értékekkel
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1.1,), (float("nan"),), (3.3,)], ["value"])
df.select(sf.max(df.value)).show()
+----------+
|max(value)|
+----------+
| NaN|
+----------+