Compartilhar via


make_valid_utf8

Retorna uma nova cadeia de caracteres na qual todas as sequências de bytes UTF-8 inválidas, se houver, são substituídas pelo caractere de substituição Unicode (U+FFFD).

Para a função SQL do Databricks correspondente, consulte a função make_valid_utf8.

Sintaxe

from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

Parâmetros

Parâmetro Tipo Description
str pyspark.sql.Column ou str Uma coluna de cadeias de caracteres, cada uma representando uma sequência de bytes UTF-8.

Devoluções

pyspark.sql.Column: a versão UTF-8 válida da cadeia de caracteres de entrada fornecida.

Exemplos

from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()