Поделиться через


TableValuedFunction.inline

Преобразует массив структур в таблицу.

Эта функция принимает входной столбец, содержащий массив структур, и возвращает новый столбец, в котором каждая структура в массиве взорвана в отдельную строку.

Синтаксис

spark.tvf.inline(input)

Параметры

Параметр Тип Description
input pyspark.sql.Column Входной столбец значений для взрыва.

Возвраты

pyspark.sql.DataFrame: Кадр данных с разорванными строками структуры.

Примеры

Пример 1. Использование встроенного массива структур

import pyspark.sql.functions as sf
spark.tvf.inline(sf.array(
    sf.named_struct(sf.lit("a"), sf.lit(1), sf.lit("b"), sf.lit(2)),
    sf.named_struct(sf.lit("a"), sf.lit(3), sf.lit("b"), sf.lit(4))
)).show()
+---+---+
|  a|  b|
+---+---+
|  1|  2|
|  3|  4|
+---+---+

Пример 2. Использование встроенного столбца массива структуры

import pyspark.sql.functions as sf
spark.tvf.inline(sf.array().astype("array<struct<a:int,b:int>>")).show()
+---+---+
|  a|  b|
+---+---+
+---+---+

Пример 3. Использование встроенного столбца массива структуры, содержащего значения NULL

import pyspark.sql.functions as sf
spark.tvf.inline(sf.array(
    sf.named_struct(sf.lit("a"), sf.lit(1), sf.lit("b"), sf.lit(2)),
    sf.lit(None),
    sf.named_struct(sf.lit("a"), sf.lit(3), sf.lit("b"), sf.lit(4))
)).show()
+----+----+
|   a|   b|
+----+----+
|   1|   2|
|NULL|NULL|
|   3|   4|
+----+----+