根据所提供的format值将输入col转换为二进制值。
format可以是“hex”、“utf-8”、“utf8”或“base64”的不区分大小写的字符串文本。 默认情况下,如果 format 省略了转换的二进制格式,则为“十六进制”。 如果至少有一个输入参数为 NULL,则该函数返回 NULL。
有关相应的 Databricks SQL 函数,请参阅 to_binary 函数。
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.to_binary(col=<col>, format=<format>)
参数
| 参数 | 类型 | Description |
|---|---|---|
col |
pyspark.sql.Column 或 str |
输入列或字符串。 |
format |
pyspark.sql.Column 或 str, optional |
用于转换二进制值的格式。 |
例子
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abc",)], ["e"])
df.select(dbf.try_to_binary(df.e, dbf.lit("utf-8")).alias('r')).collect()
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("414243",)], ["e"])
df.select(dbf.try_to_binary(df.e).alias('r')).collect()