使用提供的字符集(“US-ASCII”、“ISO-8859-1”、“UTF-8”、“UTF-16BE”、“UTF-16LE”、“UTF-16LE”、“UTF-16”、“UTF-16”、“UTF-32”之一)从二进制文件中计算第一个参数。
有关相应的 Databricks SQL 函数,请参阅 decode (键) 函数。
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.decode(col=<col>, charset=<charset>)
参数
| 参数 | 类型 | Description |
|---|---|---|
col |
pyspark.sql.Column 或 str |
要处理的目标列。 |
charset |
literal string |
用于解码到的 charset。 |
退货
pyspark.sql.Column:计算结果的列。
例子
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(b"\x61\x62\x63\x64",)], ["a"])
df.select("*", dbf.decode("a", "UTF-8")).show()