Freigeben über


make_valid_utf8

Gibt eine neue Zeichenfolge zurück, in der alle ungültigen UTF-8-Bytesequenzen (falls vorhanden) durch das Unicode-Ersetzungszeichen (U+FFFD) ersetzt werden.

Die entsprechende Databricks SQL-Funktion finden Sie unter make_valid_utf8 Funktion.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

Die Parameter

Parameter Typ Description
str pyspark.sql.Column oder str Eine Spalte mit Zeichenfolgen, die jeweils eine UTF-8-Byte-Sequenz darstellen.

Rückkehr

pyspark.sql.Column: die gültige UTF-8-Version der angegebenen Eingabezeichenfolge.

Examples

from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()