對映射中的每個鍵值對套用函數,並回傳帶有這些應用結果的映射作為對的新鍵。 支援 Spark Connect。
關於對應的 Databricks SQL 函式,請參見 transform_keys 函數。
語法
from pyspark.databricks.sql import functions as dbf
dbf.transform_keys(col=<col>, f=<f>)
參數
| 參數 | 類型 | Description |
|---|---|---|
col |
pyspark.sql.Column 或 str |
欄位名稱或表達式名稱。 |
f |
function |
一個二元函數。 |
退貨
pyspark.sql.Column:一個新的條目映射,透過對每個鍵值參數應用給定函數來計算新鍵。
範例
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(1, {"foo": -2.0, "bar": 2.0})], ("id", "data"))
row = df.select(dbf.transform_keys(
"data", lambda k, _: dbf.upper(k)).alias("data_upper")
).head()
sorted(row["data_upper"].items())
[('BAR', 2.0), ('FOO', -2.0)]