Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Yeni bir DataFrame döndürür. Özel dönüştürmeleri zincirleme için kısa söz dizimi.
Sözdizimi
transform(func: Callable[..., "DataFrame"], *args: Any, **kwargs: Any)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
func |
function | Bir DataFrame alan ve döndüren bir işlev. |
*args |
any | Huniye geçirecek konumsal bağımsız değişkenler. |
**kwargs |
any | Func'ye geçirecek anahtar sözcük bağımsız değişkenleri. |
İadeler
DataFrame: Dönüştürülen DataFrame.
Örnekler
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1, 1.0), (2, 2.0)], ["int", "float"])
def cast_all_to_int(input_df):
return input_df.select([sf.col(c).cast("int") for c in input_df.columns])
def sort_columns_asc(input_df):
return input_df.select(*sorted(input_df.columns))
df.transform(cast_all_to_int).transform(sort_columns_asc).show()
# +-----+---+
# |float|int|
# +-----+---+
# | 1| 1|
# | 2| 2|
# +-----+---+
def add_n(input_df, n):
cols = [(sf.col(c) + n).alias(c) for c in input_df.columns]
return input_df.select(cols)
df.transform(add_n, 1).transform(add_n, n=10).show()
# +---+-----+
# |int|float|
# +---+-----+
# | 12| 12.0|
# | 13| 13.0|
# +---+-----+