Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Ligne dans DataFrame. Les champs qu’il contient sont accessibles :
- comme les attributs (
row.key) - comme les valeurs de dictionnaire (
row[key])
key in row effectue une recherche dans les clés de ligne.
La ligne peut être utilisée pour créer un objet de ligne à l’aide d’arguments nommés. Il n’est pas autorisé à omettre un argument nommé pour représenter que la valeur est None ou manquante. Cette valeur doit être définie explicitement sur None dans ce cas.
Modifié dans Databricks Runtime 7.4 : les lignes créées à partir d’arguments nommés n’ont plus de noms de champs triés par ordre alphabétique et seront classées dans la position entrée.
Syntaxe
from pyspark.sql import Row
Row(tuple)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
tuple |
tuple | Éléments de ligne |
Méthodes
| Méthode | Description |
|---|---|
asDict(recursive) |
Retourne la ligne en tant que Dict[str, Any]. |
Exemples
Utilisation d’arguments nommés
from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False
Création de classes de lignes
La ligne peut également être utilisée pour créer une autre classe row-like, puis elle peut être utilisée pour créer des objets Row :
Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)
Ce formulaire peut également être utilisé pour créer des lignes sous forme de valeurs tuple, avec des champs sans nom :
row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True