Поделиться через


to_binary

Преобразует входные данные col в двоичное значение на основе предоставленного formatзначения. Это format может быть нечувствительный строковый литерал "шестнадцатеричный", "utf-8", "utf8" или "base64". По умолчанию двоичный формат для преобразования является шестнадцатеричным, если format опущен. Функция возвращает значение NULL, если хотя бы один из входных параметров имеет значение NULL.

Для соответствующей функции Databricks SQL смотрите функцию to_binary.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.to_binary(col=<col>, format=<format>)

Параметры

Параметр Тип Description
col pyspark.sql.Column или str Входной столбец или строки.
format pyspark.sql.Column или str, optional формат, используемый для преобразования двоичных значений.

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abc",)], ["e"])
df.select(dbf.try_to_binary(df.e, dbf.lit("utf-8")).alias('r')).collect()
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("414243",)], ["e"])
df.select(dbf.try_to_binary(df.e).alias('r')).collect()