Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Classifica a matriz de entrada em ordem crescente ou decrescente de acordo com a ordenação natural dos elementos da matriz. Elementos nulos serão colocados no início da matriz retornada em ordem crescente ou no final da matriz retornada em ordem decrescente.
Sintaxe
from pyspark.sql import functions as sf
sf.sort_array(col, asc=True)
Parâmetros
| Parâmetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column ou str |
Nome da coluna ou expressão. |
asc |
bool, opcional | Seja para classificar em ordem crescente ou decrescente. Se asc for True (padrão), a classificação estará em ordem crescente. Se False, em ordem decrescente. |
Devoluções
pyspark.sql.Column: matriz classificada.
Exemplos
Exemplo 1: Classificando uma matriz em ordem crescente
import pyspark.sql.functions as sf
df = spark.createDataFrame([([2, 1, None, 3],)], ['data'])
df.select(sf.sort_array(df.data)).show()
+----------------------+
|sort_array(data, true)|
+----------------------+
| [NULL, 1, 2, 3]|
+----------------------+
Exemplo 2: Classificando uma matriz em ordem decrescente
import pyspark.sql.functions as sf
df = spark.createDataFrame([([2, 1, None, 3],)], ['data'])
df.select(sf.sort_array(df.data, asc=False)).show()
+-----------------------+
|sort_array(data, false)|
+-----------------------+
| [3, 2, 1, NULL]|
+-----------------------+
Exemplo 3: Classificando uma matriz com um único elemento
import pyspark.sql.functions as sf
df = spark.createDataFrame([([1],)], ['data'])
df.select(sf.sort_array(df.data)).show()
+----------------------+
|sort_array(data, true)|
+----------------------+
| [1]|
+----------------------+
Exemplo 4: Classificando uma matriz vazia
from pyspark.sql import functions as sf
from pyspark.sql.types import ArrayType, StringType, StructField, StructType
schema = StructType([StructField("data", ArrayType(StringType()), True)])
df = spark.createDataFrame([([],)], schema=schema)
df.select(sf.sort_array(df.data)).show()
+----------------------+
|sort_array(data, true)|
+----------------------+
| []|
+----------------------+
Exemplo 5: classificando uma matriz com valores nulos
from pyspark.sql import functions as sf
from pyspark.sql.types import ArrayType, IntegerType, StructType, StructField
schema = StructType([StructField("data", ArrayType(IntegerType()), True)])
df = spark.createDataFrame([([None, None, None],)], schema=schema)
df.select(sf.sort_array(df.data)).show()
+----------------------+
|sort_array(data, true)|
+----------------------+
| [NULL, NULL, NULL]|
+----------------------+