Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Возвращает новый кадр данных. Краткий синтаксис для цепочки пользовательских преобразований.
Синтаксис
transform(func: Callable[..., "DataFrame"], *args: Any, **kwargs: Any)
Параметры
| Параметр | Тип | Описание |
|---|---|---|
func |
function | функция, которая принимает и возвращает кадр данных. |
*args |
any | Позиционные аргументы для передачи в func. |
**kwargs |
any | Аргументы ключевых слов для передачи в func. |
Возвраты
DataFrame: преобразованный кадр данных.
Примеры
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1, 1.0), (2, 2.0)], ["int", "float"])
def cast_all_to_int(input_df):
return input_df.select([sf.col(c).cast("int") for c in input_df.columns])
def sort_columns_asc(input_df):
return input_df.select(*sorted(input_df.columns))
df.transform(cast_all_to_int).transform(sort_columns_asc).show()
# +-----+---+
# |float|int|
# +-----+---+
# | 1| 1|
# | 2| 2|
# +-----+---+
def add_n(input_df, n):
cols = [(sf.col(c) + n).alias(c) for c in input_df.columns]
return input_df.select(cols)
df.transform(add_n, 1).transform(add_n, n=10).show()
# +---+-----+
# |int|float|
# +---+-----+
# | 12| 12.0|
# | 13| 13.0|
# +---+-----+