Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Berechnet den Hashcode der angegebenen Spalten und gibt das Ergebnis als Int-Spalte zurück. Unterstützt Spark Connect.
Die entsprechende Databricks SQL-Funktion finden Sie unter hash Funktion.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.hash(*cols)
Die Parameter
| Parameter | Typ | Description |
|---|---|---|
cols |
pyspark.sql.Column oder str |
Eine oder mehrere Spalten, für die berechnet werden soll. |
Rückkehr
pyspark.sql.Column: Hashwert als Int-Spalte.
Examples
Beispiel 1: Berechnen des Hashs einer einzelnen Spalte
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1')).show()
+---+---+----------+
| c1| c2| hash(c1)|
+---+---+----------+
|ABC|DEF|-757602832|
+---+---+----------+
Beispiel 2: Berechnen des Hashs mehrerer Spalten
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1', df.c2)).show()
+---+---+------------+
| c1| c2|hash(c1, c2)|
+---+---+------------+
|ABC|DEF| 599895104|
+---+---+------------+