Поделиться через


Кодирования

Вычисляет первый аргумент в двоичный файл из строки с помощью предоставленного набора символов (один из US-ASCII, ISO-8859-1, UTF-8, UTF-16BE, UTF-16LE, UTF-16LE, UTF-16, UTF-16, UTF-32).

Для соответствующей функции Databricks SQL смотрите функцию encode.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.encode(col=<col>, charset=<charset>)

Параметры

Параметр Тип Description
col pyspark.sql.Column или str Целевой столбец для работы.
charset literal string charset, используемый для кодирования.

Возвраты

pyspark.sql.Column: столбец для вычисляемых результатов.

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abcd",)], ["c"])
df.select("*", dbf.encode("c", "UTF-8")).show()