利用提供的字元集(如 'US-ASCII'、'ISO-8859-1'、'UTF-8'、'UTF-16BE'、'UTF-16LE'、'UTF-16'、'UTF-32')從字串中計算出第一個參數成二進位。
關於對應的 Databricks SQL 函式,請參見 encode 函數。
語法
from pyspark.databricks.sql import functions as dbf
dbf.encode(col=<col>, charset=<charset>)
參數
| 參數 | 類型 | Description |
|---|---|---|
col |
pyspark.sql.Column 或 str |
要處理的目標欄位。 |
charset |
literal string |
用 CharSet 來編碼。 |
退貨
pyspark.sql.Column: 欄位用於計算結果。
範例
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abcd",)], ["c"])
df.select("*", dbf.encode("c", "UTF-8")).show()