그룹에서 식의 최소값을 반환합니다.
문법
from pyspark.sql import functions as sf
sf.min(col)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
col |
pyspark.sql.Column 또는 열 이름 |
최소값이 계산되는 대상 열입니다. |
Returns
pyspark.sql.Column: 계산된 최소값을 포함하는 열입니다.
예시
예제 1: 숫자 열의 최소값 계산
import pyspark.sql.functions as sf
df = spark.range(10)
df.select(sf.min(df.id)).show()
+-------+
|min(id)|
+-------+
| 0|
+-------+
예제 2: 문자열 열의 최소값 계산
import pyspark.sql.functions as sf
df = spark.createDataFrame([("Alice",), ("Bob",), ("Charlie",)], ["name"])
df.select(sf.min("name")).show()
+---------+
|min(name)|
+---------+
| Alice|
+---------+
예제 3: null 값을 사용하여 열의 최소값 계산
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1,), (None,), (3,)], ["value"])
df.select(sf.min("value")).show()
+----------+
|min(value)|
+----------+
| 1|
+----------+
예제 4: 그룹화된 DataFrame에서 열의 최소값 계산
import pyspark.sql.functions as sf
df = spark.createDataFrame([("Alice", 1), ("Alice", 2), ("Bob", 3)], ["name", "value"])
df.groupBy("name").agg(sf.min("value")).show()
+-----+----------+
| name|min(value)|
+-----+----------+
|Alice| 1|
| Bob| 3|
+-----+----------+
예제 5: 여러 열이 있는 DataFrame에서 열의 최소값 계산
import pyspark.sql.functions as sf
df = spark.createDataFrame(
[("Alice", 1, 100), ("Bob", 2, 200), ("Charlie", 3, 300)],
["name", "value1", "value2"])
df.select(sf.min("value1"), sf.min("value2")).show()
+-----------+-----------+
|min(value1)|min(value2)|
+-----------+-----------+
| 1| 100|
+-----------+-----------+