Udostępnij przez


Kodowania

Oblicza pierwszy argument w pliku binarnym z ciągu przy użyciu podanego zestawu znaków (jeden z "US-ASCII", "ISO-8859-1", "UTF-8", "UTF-16BE", "UTF-16LE", "UTF-16", "UTF-32").

Aby uzyskać odpowiednią funkcję SQL usługi Databricks, zobacz encode funkcja.

Składnia

from pyspark.databricks.sql import functions as dbf

dbf.encode(col=<col>, charset=<charset>)

Parametry

Parameter Typ Description
col pyspark.sql.Column lub str kolumna docelowa do pracy.
charset literal string charset do użycia do kodowania.

Zwraca

pyspark.sql.Column: kolumna dla obliczonych wyników.

Przykłady

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abcd",)], ["c"])
df.select("*", dbf.encode("c", "UTF-8")).show()