Compartilhar via


Classe row

Uma linha no DataFrame. Os campos nele podem ser acessados:

  • como atributos (row.key)
  • como valores de dicionário (row[key])

key in row pesquisará por meio de chaves de linha.

A linha pode ser usada para criar um objeto de linha usando argumentos nomeados. Não é permitido omitir um argumento nomeado para representar que o valor é Nenhum ou ausente. Isso deve ser definido explicitamente como Nenhum nesse caso.

Alterado no Databricks Runtime 7.4: as linhas criadas com base em argumentos nomeados não têm mais nomes de campo classificados em ordem alfabética e serão ordenadas na posição conforme inserido.

Sintaxe

from pyspark.sql import Row

Row(tuple)

Parâmetros

Parâmetro Tipo Descrição
tuple tupla Os elementos de linha

Methods

Método Descrição
asDict(recursive) Retorna a linha como Dict[str, Any].

Exemplos

Usando argumentos nomeados

from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False

Criando classes de linha

A linha também pode ser usada para criar outra classe semelhante a Linha e, em seguida, pode ser usada para criar objetos Row:

Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)

Esse formulário também pode ser usado para criar linhas como valores de tupla, com campos sem nome:

row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True