잘못된 모든 UTF-8 바이트 시퀀스(있는 경우)가 유니코드 대체 문자(U+FFFD)로 대체되는 새 문자열을 반환합니다.
해당 Databricks SQL 함수에 대해 알아보려면 make_valid_utf8 함수를 참조하세요.
문법
from pyspark.databricks.sql import functions as dbf
dbf.make_valid_utf8(str=<str>)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
str |
pyspark.sql.Column 또는 str |
각각 UTF-8 바이트 시퀀스를 나타내는 문자열 열입니다. |
Returns
pyspark.sql.Column: 지정된 입력 문자열의 유효한 UTF-8 버전입니다.
예시
from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()