適用於:
Databricks SQL
Databricks Runtime
使用 charSet 字元編碼傳回字串的二進位表示法。
語法
encode(expr, charSet)
引數
-
exprSTRING:要編碼的表達式。 -
charSetSTRING:指定編碼的表達式。
退貨
BINARY。
支援下列字元集編碼方式(不區分大小寫):
-
'US-ASCII':七位 ASCII、ISO646-US。 -
'ISO-8859-1':ISO 拉丁字母 1,ISO-LATIN-1。 -
'UTF-8':八位UCS轉換格式。 -
'UTF-16BE':16 位 UCS 轉換格式,大端位元組順序。 -
'UTF-16LE':16 位元 UCS(統一字符集)轉換格式,小端序位元組順序。 -
'UTF-16':16 位 UCS 轉換格式,位元組順序由可選擇的位元組順序標記識別。
範例
-- Wrap encode in hex to normalize UI dependent BINARY output.
> SELECT hex(encode('Spark SQL', 'UTF-16'));
FEFF0053007000610072006B002000530051004C
> SELECT hex(encode('Spark SQL', 'US-ASCII'));
537061726B2053514C
> SELECT decode(X'FEFF0053007000610072006B002000530051004C', 'UTF-16')
Spark SQL