通过


make_valid_utf8

返回一个新字符串,其中所有无效的 UTF-8 字节序列(如果有)都由 Unicode 替换字符(U+FFFD)替换。

有关相应的 Databricks SQL 函数,请参阅 make_valid_utf8 函数

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

参数

参数 类型 Description
str pyspark.sql.Columnstr 一列字符串,每个字符串表示 UTF-8 字节序列。

退货

pyspark.sql.Column:给定输入字符串的有效 UTF-8 版本。

例子

from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()