encode-functie

Van toepassing op:aangevinkt als ja Databricks SQL aangevinkt als ja Databricks Runtime

Retourneert de binaire weergave van een tekenreeks met behulp van de charSet tekencodering.

Syntaxis

encode(expr, charSet)

Argumenten

  • expr: Een STRING expressie die moet worden gecodeerd.
  • charSet: Een STRING expressie die de codering aangeeft.

Retouren

A BINARY.

De volgende tekensetcoderingen worden ondersteund (hoofdletterongevoelig):

  • 'US-ASCII': Zeven-bits ASCII, ISO646-US.
  • 'ISO-8859-1': ISO Latijns alfabet nr. 1, ISO-LATIJNS-1.
  • 'UTF-8': Achtbits UCS-transformatieformaat.
  • 'UTF-16BE': Zestien-bit UCS Transformation Format, big-endian byte order.
  • 'UTF-16LE': Zestien-bits UCS Transformation Format, little-endian byte order.
  • 'UTF-16': Zestien-bits UCS-transformatieindeling, bytevolgorde geïdentificeerd door een optionele bytevolgordemarkering.

Als charSet geen ondersteunde codering is, wordt Azure Databricks INVALID_PARAMETER_VALUE. CHARSET.

Als expr tekens bevat die niet kunnen worden gecodeerd in charSet, wordt Azure Databricks MALFORMED_CHARACTER_CODING.

Algemene foutvoorwaarden

Voorbeelden

-- Wrap encode in hex to normalize UI dependent BINARY output.
> SELECT hex(encode('Spark SQL', 'UTF-16'));
 FEFF0053007000610072006B002000530051004C

> SELECT hex(encode('Spark SQL', 'US-ASCII'));
537061726B2053514C

> SELECT decode(X'FEFF0053007000610072006B002000530051004C', 'UTF-16')
 Spark SQL

-- U+00E9 (é) cannot be encoded in US-ASCII.
> SELECT encode('café', 'US-ASCII');
  Error: MALFORMED_CHARACTER_CODING