Поделиться через


mask

Маскирует заданное строковое значение. Это может быть полезно для создания копий таблиц с удаленными конфиденциальными сведениями.

Для соответствующей функции Databricks SQL смотрите функцию mask.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.mask(col=<col>, upperChar=<upperChar>, lowerChar=<lowerChar>, digitChar=<digitChar>, otherChar=<otherChar>)

Параметры

Параметр Тип Description
col pyspark.sql.Column или str целевой столбец для вычисления.
upperChar pyspark.sql.Column или str, optional символ для замены символов верхнего регистра символами. Укажите ЗНАЧЕНИЕ NULL, чтобы сохранить исходный символ.
lowerChar pyspark.sql.Column или str, optional символ для замены символов нижнего регистра символами. Укажите ЗНАЧЕНИЕ NULL, чтобы сохранить исходный символ.
digitChar pyspark.sql.Column или str, optional символ для замены символов цифр. Укажите ЗНАЧЕНИЕ NULL, чтобы сохранить исходный символ.
otherChar pyspark.sql.Column или str, optional символ для замены всех остальных символов. Укажите ЗНАЧЕНИЕ NULL, чтобы сохранить исходный символ.

Возвраты

pyspark.sql.Column:

Примеры

df = spark.createDataFrame([("AbCD123-@$#",), ("abcd-EFGH-8765-4321",)], ['data'])
df.select(mask(df.data).alias('r')).collect()
df.select(mask(df.data, lit('Y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d'), lit('*')).alias('r')).collect()