Freigeben über


hash

Berechnet den Hashcode der angegebenen Spalten und gibt das Ergebnis als Int-Spalte zurück. Unterstützt Spark Connect.

Die entsprechende Databricks SQL-Funktion finden Sie unter hash Funktion.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.hash(*cols)

Die Parameter

Parameter Typ Description
cols pyspark.sql.Column oder str Eine oder mehrere Spalten, für die berechnet werden soll.

Rückkehr

pyspark.sql.Column: Hashwert als Int-Spalte.

Examples

Beispiel 1: Berechnen des Hashs einer einzelnen Spalte

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1')).show()
+---+---+----------+
| c1| c2|  hash(c1)|
+---+---+----------+
|ABC|DEF|-757602832|
+---+---+----------+

Beispiel 2: Berechnen des Hashs mehrerer Spalten

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1', df.c2)).show()
+---+---+------------+
| c1| c2|hash(c1, c2)|
+---+---+------------+
|ABC|DEF|   599895104|
+---+---+------------+