Função validate_utf8
Aplica-se a: Databricks Runtime 15.4 e posterior
Retorna o valor de entrada se ele corresponder a uma cadeia de caracteres UTF-8 válida ou gera INVALID_UTF8_STRING
de outra forma.
Sintaxe
validate_utf8(strExpr)
Argumentos
strExpr
: UmaSTRING
expressão.
Devoluções
A STRING
que é byte-wise igual ao strExpr
caso de representar uma cadeia de caracteres UTF-8 válida, ou gera INVALID_UTF8_STRING
de outra forma.
Para retornar NULL
se a entrada não for uma cadeia de caracteres UTF-8 válida, use a função try_validate_utf8 .
Exemplos
– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
Spark
– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
SQL
– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
a
– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
[INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.