집계 함수: 목록의 지정된 열이 집계되는지 여부를 나타내고, 집계된 열 GROUP BY 에 대해 1을 반환하고, 결과 집합에 집계되지 않은 경우 0을 반환합니다.
문법
from pyspark.sql import functions as sf
sf.grouping(col)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
col |
pyspark.sql.Column 또는 str |
집계되는지 확인할 열입니다. |
Returns
pyspark.sql.Column: 집계된 경우 1을 반환하고 결과 집합에 집계되지 않은 경우 0을 반환합니다.
예시
예제 1: 큐브 작업에서 그룹화 상태 확인
from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], ("name", "age"))
df.cube("name").agg(sf.grouping("name"), sf.sum("age")).orderBy("name").show()
+-----+--------------+--------+
| name|grouping(name)|sum(age)|
+-----+--------------+--------+
| NULL| 1| 7|
|Alice| 0| 2|
| Bob| 0| 5|
+-----+--------------+--------+