MD5 다이제스트를 계산하고 값을 32자 16진수 문자열로 반환합니다. Spark Connect를 지원합니다.
해당 Databricks SQL 함수에 대해 알아보려면 md5 함수를 참조하세요.
문법
from pyspark.databricks.sql import functions as dbf
dbf.md5(col=<col>)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
col |
pyspark.sql.Column 또는 str |
계산할 대상 열입니다. |
Returns
pyspark.sql.Column: 계산된 결과의 열입니다.
예시
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC',)], ['a'])
df.select('*', dbf.md5('a')).show(truncate=False)
+---+--------------------------------+
|a |md5(a) |
+---+--------------------------------+
|ABC|902fbdd2b1df0c4f70b4a5d23525e932|
+---+--------------------------------+