다음을 통해 공유


posexplode_outer

지정된 배열 또는 맵에 위치가 있는 각 요소에 대한 새 행을 반환합니다. posexplode와 달리 배열/맵이 null이거나 비어 있으면 행(null, null)이 생성됩니다. 달리 지정하지 않는 한 위치 및 col 배열의 요소 및 keyvalue 맵의 요소에 기본 열 이름을 pos 사용합니다.

문법

from pyspark.sql import functions as sf

sf.posexplode_outer(col)

매개 변수

매개 변수 유형 Description
col pyspark.sql.Column 또는 열 이름 작업할 대상 열입니다.

Returns

pyspark.sql.Column: 별도의 열로 위치를 포함하여 배열 항목 또는 지도 키 값당 하나의 행입니다.

예시

예제 1: 배열 열 사용

from pyspark.sql import functions as sf
df = spark.sql('SELECT * FROM VALUES (1,ARRAY(1,2,3,NULL)), (2,ARRAY()), (3,NULL) AS t(i,a)')
df.select('*', sf.posexplode_outer('a')).show()
+---+---------------+----+----+
|  i|              a| pos| col|
+---+---------------+----+----+
|  1|[1, 2, 3, NULL]|   0|   1|
|  1|[1, 2, 3, NULL]|   1|   2|
|  1|[1, 2, 3, NULL]|   2|   3|
|  1|[1, 2, 3, NULL]|   3|NULL|
|  2|             []|NULL|NULL|
|  3|           NULL|NULL|NULL|
+---+---------------+----+----+

예제 2: 지도 열 사용

from pyspark.sql import functions as sf
df = spark.sql('SELECT * FROM VALUES (1,MAP(1,2,3,4,5,NULL)), (2,MAP()), (3,NULL) AS t(i,m)')
df.select('*', sf.posexplode_outer('m')).show(truncate=False)
+---+---------------------------+----+----+-----+
|i  |m                          |pos |key |value|
+---+---------------------------+----+----+-----+
|1  |{1 -> 2, 3 -> 4, 5 -> NULL}|0   |1   |2    |
|1  |{1 -> 2, 3 -> 4, 5 -> NULL}|1   |3   |4    |
|1  |{1 -> 2, 3 -> 4, 5 -> NULL}|2   |5   |NULL |
|2  |{}                         |NULL|NULL|NULL |
|3  |NULL                       |NULL|NULL|NULL |
+---+---------------------------+----+----+-----+