Поделиться через


Функция encode

Область применения: флажок Databricks SQL флажок Databricks Runtime

Возвращает двоичное представление строки с использованием кодировки символов charSet.

Синтаксис

encode(expr, charSet)

Аргументы

  • exprSTRING: выражение, закодированное.
  • charSetSTRING: выражение, указывающее кодировку.

Возвраты

BINARY.

Поддерживаются следующие кодировки набора символов (без учета регистра):

  • 'US-ASCII': семи-разрядный ASCII, ISO646-US.
  • 'ISO-8859-1': латинский алфавит ISO No 1, ISO-LATIN-1.
  • 'UTF-8': восьмибитовый формат преобразования UCS.
  • 'UTF-16BE': шестнадцати-разрядный формат преобразования UCS, порядок байтов больших байтов.
  • 'UTF-16LE': шестнадцати-разрядный формат преобразования UCS, маленький порядок байтов.
  • 'UTF-16': шестнадцателетний формат преобразования UCS, порядок байтов, определенный необязательным знаком порядка байтов.

Примеры

-- Wrap encode in hex to normalize UI dependent BINARY output.
> SELECT hex(encode('Spark SQL', 'UTF-16'));
 FEFF0053007000610072006B002000530051004C

> SELECT hex(encode('Spark SQL', 'US-ASCII'));
537061726B2053514C

> SELECT decode(X'FEFF0053007000610072006B002000530051004C', 'UTF-16')
 Spark SQL