Partilhar via


Classe de fila

Uma linha no DataFrame. Os campos nele presentes podem ser acedidos:

  • atributos semelhantes (row.key)
  • como os valores do dicionário (row[key])

key in row Vou pesquisar nas chaves de linhas.

A linha pode ser usada para criar um objeto linha usando argumentos nomeados. Não é permitido omitir um argumento nomeado para representar que o valor é Nenhum ou está em falta. Isto deve ser explicitamente definido como Nenhum neste caso.

Alterado no Databricks Runtime 7.4: As linhas criadas a partir de argumentos nomeados já não têm os nomes dos campos ordenados alfabeticamente e serão ordenados na posição em que foram introduzidas.

Sintaxe

from pyspark.sql import Row

Row(tuple)

Parâmetros

Parâmetro Tipo Descrição
tuple cadeia de identificação Os elementos da série

Methods

Método Descrição
asDict(recursive) Devolve a fila como Dict[str, Any].

Exemplos

Utilização de argumentos nomeados

from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False

Criação de classes de linha

Row também pode ser usado para criar outra classe semelhante a Row, e depois pode ser usado para criar objetos Row:

Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)

Esta forma também pode ser usada para criar linhas como valores de tupla, com campos sem nome:

row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True