Udostępnij przez


make_valid_utf8

Zwraca nowy ciąg, w którym wszystkie nieprawidłowe sekwencje bajtów UTF-8, jeśli istnieją, są zastępowane znakiem zastępczym Unicode (U+FFFD).

Aby uzyskać odpowiednią funkcję SQL usługi Databricks, zobacz make_valid_utf8 funkcja.

Składnia

from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

Parametry

Parameter Typ Description
str pyspark.sql.Column lub str Kolumna ciągów, z których każda reprezentuje sekwencję bajtów UTF-8.

Zwraca

pyspark.sql.Column: prawidłowa wersja utF-8 danego ciągu wejściowego.

Przykłady

from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()