Classe de ligne

Ligne dans DataFrame. Les champs qu’il contient sont accessibles :

comme les attributs (row.key)
comme les valeurs de dictionnaire (row[key])

key in row effectue une recherche dans les clés de ligne.

La ligne peut être utilisée pour créer un objet de ligne à l’aide d’arguments nommés. Il n’est pas autorisé à omettre un argument nommé pour représenter que la valeur est None ou manquante. Cette valeur doit être définie explicitement sur None dans ce cas.

Modifié dans Databricks Runtime 7.4 : les lignes créées à partir d’arguments nommés n’ont plus de noms de champs triés par ordre alphabétique et seront classées dans la position entrée.

Syntaxe

from pyspark.sql import Row

Row(tuple)

Paramètres

Paramètre	Type	Description
`tuple`	tuple	Éléments de ligne

Méthodes

Méthode	Description
`asDict(recursive)`	Retourne la ligne en tant que `Dict[str, Any]`.

Exemples

Utilisation d’arguments nommés

from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False

Création de classes de lignes

La ligne peut également être utilisée pour créer une autre classe row-like, puis elle peut être utilisée pour créer des objets Row :

Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)

Ce formulaire peut également être utilisé pour créer des lignes sous forme de valeurs tuple, avec des champs sans nom :

row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-03-15