그룹화

집계 함수: 목록의 지정된 열이 집계되는지 여부를 나타내고, 집계된 열 GROUP BY 에 대해 1을 반환하고, 결과 집합에 집계되지 않은 경우 0을 반환합니다.

문법

from pyspark.sql import functions as sf

sf.grouping(col)

매개 변수

매개 변수	유형	Description
`col`	`pyspark.sql.Column` 또는 str	집계되는지 확인할 열입니다.

Returns

pyspark.sql.Column: 집계된 경우 1을 반환하고 결과 집합에 집계되지 않은 경우 0을 반환합니다.

예시

예제 1: 큐브 작업에서 그룹화 상태 확인

from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], ("name", "age"))
df.cube("name").agg(sf.grouping("name"), sf.sum("age")).orderBy("name").show()

+-----+--------------+--------+
| name|grouping(name)|sum(age)|
+-----+--------------+--------+
| NULL|             1|       7|
|Alice|             0|       2|
|  Bob|             0|       5|
+-----+--------------+--------+

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-02-01