编码

使用提供的字符集（“US-ASCII”、“ISO-8859-1”、“UTF-8”、“UTF-16BE”、“UTF-16LE”、“UTF-16LE”、“UTF-16”、“UTF-16”、“UTF-32”之一）从字符串中计算第一个参数。

有关相应的 Databricks SQL 函数，请参阅 encode 函数。

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.encode(col=<col>, charset=<charset>)

参数	类型	Description
`col`	`pyspark.sql.Column` 或 `str`	要处理的目标列。
`charset`	`literal string`	用于编码的 charset。

pyspark.sql.Column：计算结果的列。

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abcd",)], ["c"])
df.select("*", dbf.encode("c", "UTF-8")).show()

此页面是否有帮助？