Поделиться через


md5

Вычисляет дайджест MD5 и возвращает значение в виде шестнадцатеричной строки символов. Поддерживает Spark Connect.

Для соответствующей функции Databricks SQL смотрите функцию md5.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.md5(col=<col>)

Параметры

Параметр Тип Description
col pyspark.sql.Column или str Целевой столбец для вычисления.

Возвраты

pyspark.sql.Column: столбец для вычисляемых результатов.

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC',)], ['a'])
df.select('*', dbf.md5('a')).show(truncate=False)
+---+--------------------------------+
|a  |md5(a)                          |
+---+--------------------------------+
|ABC|902fbdd2b1df0c4f70b4a5d23525e932|
+---+--------------------------------+