Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Calcula la distancia levenshtein de las dos cadenas dadas.
Para obtener la función SQL de Databricks correspondiente, consulte levenshtein function.
Syntax
from pyspark.sql import functions as dbf
dbf.levenshtein(left=<left>, right=<right>, threshold=<threshold>)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
left |
pyspark.sql.Column o str |
Primer valor de columna. |
right |
pyspark.sql.Column o str |
Segundo valor de columna. |
threshold |
intopcional |
Si se establece cuando la distancia levenshtein de las dos cadenas dadas es menor o igual que un umbral determinado, devuelve la distancia del resultado o -1 |
Devoluciones
pyspark.sql.Column: distancia levenshtein como valor entero.
Examples
from pyspark.sql import functions as dbf
df = spark.createDataFrame([('kitten', 'sitting',)], ['l', 'r'])
df.select('*', dbf.levenshtein('l', 'r')).show()
df.select('*', dbf.levenshtein(df.l, df.r, 2)).show()