Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Tworzy nowy wiersz dla kolumny json zgodnie z podanymi nazwami pól.
Składnia
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parametry
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column lub str |
Kolumna ciągu w formacie JSON. |
fields |
str | Pole lub pola do wyodrębnienia. |
Zwraca
pyspark.sql.Column: nowy wiersz dla każdej podanej wartości pola z obiektu json
Przykłady
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]