Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Devolve um booleano indicando se o array contém o valor indicado. Devolve nulo se o array for nulo, true se o array contiver o valor dado, e false caso contrário.
Sintaxe
from pyspark.sql import functions as sf
sf.array_contains(col, value)
Parâmetros
| Parâmetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column ou str |
A coluna alvo que contém os arrays. |
value |
Qualquer | O valor ou coluna a verificar no array. |
Devoluções
pyspark.sql.Column: Uma nova Coluna do tipo Booleano, onde cada valor indica se o array correspondente da coluna de entrada contém o valor especificado.
Examples
Exemplo 1: Uso básico da função array_contains.
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"],), ([],)], ['data'])
df.select(sf.array_contains(df.data, "a")).show()
+-----------------------+
|array_contains(data, a)|
+-----------------------+
| true|
| false|
+-----------------------+
Exemplo 2: Utilização de array_contains função com uma coluna.
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"], "c"),
(["c", "d", "e"], "d"),
(["e", "a", "c"], "b")], ["data", "item"])
df.select(sf.array_contains(df.data, sf.col("item"))).show()
+--------------------------+
|array_contains(data, item)|
+--------------------------+
| true|
| true|
| false|
+--------------------------+
Exemplo 3: Tente usar array_contains função com um array nulo.
from pyspark.sql import functions as sf
df = spark.createDataFrame([(None,), (["a", "b", "c"],)], ['data'])
df.select(sf.array_contains(df.data, "a")).show()
+-----------------------+
|array_contains(data, a)|
+-----------------------+
| NULL|
| true|
+-----------------------+
Exemplo 4: Utilização de array_contains com uma coluna de array contendo valores nulos.
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", None, "c"],)], ['data'])
df.select(sf.array_contains(df.data, "a")).show()
+-----------------------+
|array_contains(data, a)|
+-----------------------+
| true|
+-----------------------+