Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce una nuova riga per ogni elemento nella matrice o nella mappa specificata. A differenza di esplodere, se la matrice/mappa è null o vuota, viene generato null. Usa il nome col di colonna predefinito per gli elementi nella matrice e keyvalue per gli elementi della mappa, se non diversamente specificato.
Sintassi
from pyspark.sql import functions as sf
sf.explode_outer(col)
Parametri
| Parametro | TIPO | Description |
|---|---|---|
col |
pyspark.sql.Column o il nome della colonna |
Colonna di destinazione su cui lavorare. |
Restituzioni
pyspark.sql.Column: una riga per ogni elemento della matrice o valore della chiave della mappa.
Esempi
Esempio 1: Uso di una colonna di matrice
from pyspark.sql import functions as sf
df = spark.sql('SELECT * FROM VALUES (1,ARRAY(1,2,3,NULL)), (2,ARRAY()), (3,NULL) AS t(i,a)')
df.select('*', sf.explode_outer('a')).show()
+---+---------------+----+
| i| a| col|
+---+---------------+----+
| 1|[1, 2, 3, NULL]| 1|
| 1|[1, 2, 3, NULL]| 2|
| 1|[1, 2, 3, NULL]| 3|
| 1|[1, 2, 3, NULL]|NULL|
| 2| []|NULL|
| 3| NULL|NULL|
+---+---------------+----+
Esempio 2: Uso di una colonna della mappa
from pyspark.sql import functions as sf
df = spark.sql('SELECT * FROM VALUES (1,MAP(1,2,3,4,5,NULL)), (2,MAP()), (3,NULL) AS t(i,m)')
df.select('*', sf.explode_outer('m')).show(truncate=False)
+---+---------------------------+----+-----+
|i |m |key |value|
+---+---------------------------+----+-----+
|1 |{1 -> 2, 3 -> 4, 5 -> NULL}|1 |2 |
|1 |{1 -> 2, 3 -> 4, 5 -> NULL}|3 |4 |
|1 |{1 -> 2, 3 -> 4, 5 -> NULL}|5 |NULL |
|2 |{} |NULL|NULL |
|3 |NULL |NULL|NULL |
+---+---------------------------+----+-----+