Поделиться через


Декодирования

Вычисляет первый аргумент в строку из двоичного файла с помощью предоставленного набора символов (один из US-ASCII, ISO-8859-1, UTF-8, UTF-16BE, UTF-16LE, UTF-16LE, UTF-166, UTF-32).

Соответствующая функция Databricks SQL см. в разделе decode (key).

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.decode(col=<col>, charset=<charset>)

Параметры

Параметр Тип Description
col pyspark.sql.Column или str Целевой столбец для работы.
charset literal string charset, используемый для декодирования.

Возвраты

pyspark.sql.Column: столбец для вычисляемых результатов.

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(b"\x61\x62\x63\x64",)], ["a"])
df.select("*", dbf.decode("a", "UTF-8")).show()