Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Trie le tableau d’entrée dans l’ordre croissant ou décroissant en fonction de l’ordre naturel des éléments du tableau. Les éléments Null sont placés au début du tableau retourné dans l’ordre croissant ou à la fin du tableau retourné dans l’ordre décroissant.
Syntaxe
from pyspark.sql import functions as sf
sf.sort_array(col, asc=True)
Paramètres
| Paramètre | Type | Descriptif |
|---|---|---|
col |
pyspark.sql.Column ou str |
Nom de la colonne ou de l’expression. |
asc |
bool, facultatif | Indique s’il faut trier par ordre croissant ou décroissant. Si asc a la valeur True (valeur par défaut), le tri est dans l’ordre croissant. Si la valeur est False, dans l’ordre décroissant. |
Retours
pyspark.sql.Column: tableau trié.
Examples
Exemple 1 : Tri d’un tableau dans l’ordre croissant
import pyspark.sql.functions as sf
df = spark.createDataFrame([([2, 1, None, 3],)], ['data'])
df.select(sf.sort_array(df.data)).show()
+----------------------+
|sort_array(data, true)|
+----------------------+
| [NULL, 1, 2, 3]|
+----------------------+
Exemple 2 : Tri d’un tableau dans l’ordre décroissant
import pyspark.sql.functions as sf
df = spark.createDataFrame([([2, 1, None, 3],)], ['data'])
df.select(sf.sort_array(df.data, asc=False)).show()
+-----------------------+
|sort_array(data, false)|
+-----------------------+
| [3, 2, 1, NULL]|
+-----------------------+
Exemple 3 : Tri d’un tableau avec un seul élément
import pyspark.sql.functions as sf
df = spark.createDataFrame([([1],)], ['data'])
df.select(sf.sort_array(df.data)).show()
+----------------------+
|sort_array(data, true)|
+----------------------+
| [1]|
+----------------------+
Exemple 4 : Tri d’un tableau vide
from pyspark.sql import functions as sf
from pyspark.sql.types import ArrayType, StringType, StructField, StructType
schema = StructType([StructField("data", ArrayType(StringType()), True)])
df = spark.createDataFrame([([],)], schema=schema)
df.select(sf.sort_array(df.data)).show()
+----------------------+
|sort_array(data, true)|
+----------------------+
| []|
+----------------------+
Exemple 5 : Tri d’un tableau avec des valeurs Null
from pyspark.sql import functions as sf
from pyspark.sql.types import ArrayType, IntegerType, StructType, StructField
schema = StructType([StructField("data", ArrayType(IntegerType()), True)])
df = spark.createDataFrame([([None, None, None],)], schema=schema)
df.select(sf.sort_array(df.data)).show()
+----------------------+
|sort_array(data, true)|
+----------------------+
| [NULL, NULL, NULL]|
+----------------------+