共用方式為


make_valid_utf8

回傳一個新字串,所有無效的 UTF-8 位元組序列(如有)都被 Unicode 替換字元(U+FFFD)取代。

關於對應的 Databricks SQL 函式,請參見 make_valid_utf8 函數

語法

from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

參數

參數 類型 Description
str pyspark.sql.Columnstr 一列字串,每個字串代表一個 UTF-8 位元組序列。

退貨

pyspark.sql.Column: 為給定輸入字串的有效 UTF-8 版本。

範例

from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()