구조체 배열을 테이블로 분해합니다. 인라인과 달리 배열이 null이거나 비어 있으면 중첩된 각 열에 대해 null이 생성됩니다.
문법
spark.tvf.inline_outer(input)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
input |
pyspark.sql.Column |
분해할 값의 입력 열입니다. |
Returns
pyspark.sql.DataFrame: 쪼개진 구조체 행이 있는 DataFrame이거나 배열이 비어 있거나 null인 경우 null 값입니다.
예시
import pyspark.sql.functions as sf
spark.tvf.inline_outer(sf.array(
sf.named_struct(sf.lit("a"), sf.lit(1), sf.lit("b"), sf.lit(2)),
sf.named_struct(sf.lit("a"), sf.lit(3), sf.lit("b"), sf.lit(4))
)).show()
+---+---+
| a| b|
+---+---+
| 1| 2|
| 3| 4|
+---+---+
import pyspark.sql.functions as sf
spark.tvf.inline_outer(sf.array().astype("array<struct<a:int,b:int>>")).show()
+----+----+
| a| b|
+----+----+
|NULL|NULL|
+----+----+