共用方式為


行列級

DataFrame 中的一列。 其中的欄位可存取:

  • 類屬性(row.key
  • 類似字典值(row[key]

key in row 我會透過列鍵搜尋。

列可以用來建立列物件,並使用命名參數。 不允許省略指定參數以表示該值為 None 或缺失。 在這種情況下,這個值應該明確設為「無」。

Databricks 執行時 7.4 版本變更:由命名參數建立的欄位名稱不再按字母順序排序,依輸入位置排序。

語法

from pyspark.sql import Row

Row(tuple)

參數

參數 類型 說明
tuple Tuple 行元素

方法

方法 說明
asDict(recursive) 返回該列為 Dict[str, Any]

Examples

使用命名參數

from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False

建立列類別

Row 也可以用來建立另一個類 Row 的類別,然後用來建立 Row 物件:

Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)

此形式也可用於建立列為元組值,並包含未命名欄位:

row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True