Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Tworzy nowy wiersz dla kolumny json zgodnie z podanymi nazwami pól.
Składnia
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parametry
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column lub str |
Kolumna ciągu w formacie JSON. |
fields |
str | Pole lub pola do wyodrębnienia. |
Zwraca
pyspark.sql.Column: nowy wiersz dla każdej podanej wartości pola z obiektu json
Przykłady
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]