返回一个新字符串,其中所有无效的 UTF-8 字节序列(如果有)都由 Unicode 替换字符(U+FFFD)替换。
有关相应的 Databricks SQL 函数,请参阅 make_valid_utf8 函数。
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.make_valid_utf8(str=<str>)
参数
| 参数 | 类型 | Description |
|---|---|---|
str |
pyspark.sql.Column 或 str |
一列字符串,每个字符串表示 UTF-8 字节序列。 |
退货
pyspark.sql.Column:给定输入字符串的有效 UTF-8 版本。
例子
from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()