다음을 통해 공유


디코딩

제공된 문자 집합('US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16', 'UTF-32' 중 하나)을 사용하여 이진 파일에서 문자열로 첫 번째 인수를 계산합니다.

해당 Databricks SQL 함수는 (키) 함수를 참조decode하세요.

문법

from pyspark.databricks.sql import functions as dbf

dbf.decode(col=<col>, charset=<charset>)

매개 변수

매개 변수 유형 Description
col pyspark.sql.Column 또는 str 작업할 대상 열입니다.
charset literal string 디코딩하는 데 사용할 charset입니다.

Returns

pyspark.sql.Column: 계산된 결과의 열입니다.

예시

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(b"\x61\x62\x63\x64",)], ["a"])
df.select("*", dbf.decode("a", "UTF-8")).show()