Delen via


hekje

Berekent de hashcode van opgegeven kolommen en retourneert het resultaat als een int-kolom. Ondersteunt Spark Connect.

Voor de overeenkomstige Databricks SQL-functie, zie de hash functie.

Syntaxis

from pyspark.databricks.sql import functions as dbf

dbf.hash(*cols)

Parameterwaarden

Kenmerk Typologie Description
cols pyspark.sql.Column of str Een of meer kolommen waarop u wilt berekenen.

Retouren

pyspark.sql.Column: hash-waarde als int-kolom.

Voorbeelden

Voorbeeld 1: Hash van één kolom berekenen

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1')).show()
+---+---+----------+
| c1| c2|  hash(c1)|
+---+---+----------+
|ABC|DEF|-757602832|
+---+---+----------+

Voorbeeld 2: Hash van meerdere kolommen berekenen

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1', df.c2)).show()
+---+---+------------+
| c1| c2|hash(c1, c2)|
+---+---+------------+
|ABC|DEF|   599895104|
+---+---+------------+