Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Uma linha no DataFrame. Os campos nele podem ser acessados:
- como atributos (
row.key) - como valores de dicionário (
row[key])
key in row pesquisará por meio de chaves de linha.
A linha pode ser usada para criar um objeto de linha usando argumentos nomeados. Não é permitido omitir um argumento nomeado para representar que o valor é Nenhum ou ausente. Isso deve ser definido explicitamente como Nenhum nesse caso.
Alterado no Databricks Runtime 7.4: as linhas criadas com base em argumentos nomeados não têm mais nomes de campo classificados em ordem alfabética e serão ordenadas na posição conforme inserido.
Sintaxe
from pyspark.sql import Row
Row(tuple)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
tuple |
tupla | Os elementos de linha |
Methods
| Método | Descrição |
|---|---|
asDict(recursive) |
Retorna a linha como Dict[str, Any]. |
Exemplos
Usando argumentos nomeados
from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False
Criando classes de linha
A linha também pode ser usada para criar outra classe semelhante a Linha e, em seguida, pode ser usada para criar objetos Row:
Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)
Esse formulário também pode ser usado para criar linhas como valores de tupla, com campos sem nome:
row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True