제공된 문자 집합('US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16', 'UTF-32' 중 하나)을 사용하여 이진 파일에서 문자열로 첫 번째 인수를 계산합니다.
해당 Databricks SQL 함수는 (키) 함수를 참조decode하세요.
문법
from pyspark.databricks.sql import functions as dbf
dbf.decode(col=<col>, charset=<charset>)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
col |
pyspark.sql.Column 또는 str |
작업할 대상 열입니다. |
charset |
literal string |
디코딩하는 데 사용할 charset입니다. |
Returns
pyspark.sql.Column: 계산된 결과의 열입니다.
예시
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(b"\x61\x62\x63\x64",)], ["a"])
df.select("*", dbf.decode("a", "UTF-8")).show()