Partekatu honen bidez:


Row (clase)

Una fila en DataFrame. Se puede acceder a los campos en él:

  • como atributos (row.key)
  • como los valores del diccionario (row[key])

key in row buscará en las claves de fila.

La fila se puede usar para crear un objeto de fila mediante argumentos con nombre. No se permite omitir un argumento con nombre para representar que el valor es Ninguno o falta. Esto debe establecerse explícitamente en Ninguno en este caso.

Cambiado en Databricks Runtime 7.4: las filas creadas a partir de argumentos con nombre ya no tienen nombres de campo ordenados alfabéticamente y se ordenarán en la posición especificada.

Sintaxis

from pyspark.sql import Row

Row(tuple)

Parámetros

Parámetro Tipo Descripción
tuple tupla Los elementos row

Methods

Método Descripción
asDict(recursive) Devuelve la fila como Dict[str, Any].

Ejemplos

Uso de argumentos con nombre

from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False

Creación de clases row

La fila también se puede usar para crear otra clase similar a la fila y, a continuación, se podría usar para crear objetos Row:

Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)

Este formulario también se puede usar para crear filas como valores de tupla, con campos sin nombre:

row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True