使用提供的字符集(“US-ASCII”、“ISO-8859-1”、“UTF-8”、“UTF-16BE”、“UTF-16LE”、“UTF-16LE”、“UTF-16”、“UTF-16”、“UTF-32”之一)从字符串中计算第一个参数。
有关相应的 Databricks SQL 函数,请参阅 encode 函数。
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.encode(col=<col>, charset=<charset>)
参数
| 参数 | 类型 | Description |
|---|---|---|
col |
pyspark.sql.Column 或 str |
要处理的目标列。 |
charset |
literal string |
用于编码的 charset。 |
退货
pyspark.sql.Column:计算结果的列。
例子
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abcd",)], ["c"])
df.select("*", dbf.encode("c", "UTF-8")).show()