Partager via


Classe de ligne

Ligne dans DataFrame. Les champs qu’il contient sont accessibles :

  • comme les attributs (row.key)
  • comme les valeurs de dictionnaire (row[key])

key in row effectue une recherche dans les clés de ligne.

La ligne peut être utilisée pour créer un objet de ligne à l’aide d’arguments nommés. Il n’est pas autorisé à omettre un argument nommé pour représenter que la valeur est None ou manquante. Cette valeur doit être définie explicitement sur None dans ce cas.

Modifié dans Databricks Runtime 7.4 : les lignes créées à partir d’arguments nommés n’ont plus de noms de champs triés par ordre alphabétique et seront classées dans la position entrée.

Syntaxe

from pyspark.sql import Row

Row(tuple)

Paramètres

Paramètre Type Description
tuple tuple Éléments de ligne

Méthodes

Méthode Description
asDict(recursive) Retourne la ligne en tant que Dict[str, Any].

Exemples

Utilisation d’arguments nommés

from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False

Création de classes de lignes

La ligne peut également être utilisée pour créer une autre classe row-like, puis elle peut être utilisée pour créer des objets Row :

Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)

Ce formulaire peut également être utilisé pour créer des lignes sous forme de valeurs tuple, avec des champs sans nom :

row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True