적용 대상:
Databricks SQL
Databricks Runtime
charSet 문자 인코딩을 사용하여 문자열의 이진 표현을 반환합니다.
구문
encode(expr, charSet)
인수
-
exprSTRING: 인코딩할 식입니다. -
charSetSTRING: 인코딩을 지정하는 식입니다.
반품
BINARY.
지원되는 문자 집합 인코딩은 다음과 같습니다(대/소문자를 구분하지 않음).
-
'US-ASCII': 7비트 ASCII, ISO646-US. -
'ISO-8859-1': ISO Latin Alphabet No. 1, ISO-LATIN-1. -
'UTF-8': 8비트 UCS 변환 형식입니다. -
'UTF-16BE': 16비트 UCS 변환 형식, 빅 엔디언 바이트 순서입니다. -
'UTF-16LE': 16비트 UCS 변환 형식, 리틀 엔디안 바이트 순서입니다. -
'UTF-16': 16비트 UCS 변환 형식, 선택적 바이트 순서 표시로 식별되는 바이트 순서입니다.
charSet 지원되는 인코딩이 아니면 Azure Databricks INVALID_PARAMETER_VALUE 발생합니다. CHARSET.
expr
charSet 인코딩할 수 없는 문자가 포함되어 있으면 Azure Databricks MALFORMED_CHARACTER_CODING 발생합니다.
일반적인 오류 조건
예제
-- Wrap encode in hex to normalize UI dependent BINARY output.
> SELECT hex(encode('Spark SQL', 'UTF-16'));
FEFF0053007000610072006B002000530051004C
> SELECT hex(encode('Spark SQL', 'US-ASCII'));
537061726B2053514C
> SELECT decode(X'FEFF0053007000610072006B002000530051004C', 'UTF-16')
Spark SQL
-- U+00E9 (é) cannot be encoded in US-ASCII.
> SELECT encode('café', 'US-ASCII');
Error: MALFORMED_CHARACTER_CODING