Bagikan melalui


hash

Menghitung kode hash kolom yang diberikan, dan mengembalikan hasilnya sebagai kolom int. Mendukung Spark Connect.

Untuk fungsi Databricks SQL yang sesuai, lihat hash fungsi.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.hash(*cols)

Parameter-parameternya

Pengaturan Tipe Description
cols pyspark.sql.Column atau str Satu atau beberapa kolom untuk dihitung.

Pengembalian Barang

pyspark.sql.Column: nilai hash sebagai kolom int.

Examples

Contoh 1: Hash komputasi dari satu kolom

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1')).show()
+---+---+----------+
| c1| c2|  hash(c1)|
+---+---+----------+
|ABC|DEF|-757602832|
+---+---+----------+

Contoh 2: Menghitung hash dari beberapa kolom

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1', df.c2)).show()
+---+---+------------+
| c1| c2|hash(c1, c2)|
+---+---+------------+
|ABC|DEF|   599895104|
+---+---+------------+