Поделиться через


Тип конфиденциальной информации: проверяющие элементы REGEX и дополнительные проверка

Важно!

Центр обслуживания клиентов Майкрософт не может оказывать помощь при создании пользовательских категорий или шаблонов регулярных выражений. Инженеры службы поддержки могут предоставить ограниченную поддержку функции, например предоставить примеры шаблонов регулярных выражений для тестирования функции или помочь в устранении неполадок с существующим шаблоном регулярного выражения, который не активируется должным образом. Однако инженеры службы поддержки не могут гарантировать, что какая-либо пользовательская разработка, соответствующая содержимому, соответствует вашим требованиям или обязательствам.

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Проверяющие элементы регулярных выражений типа конфиденциальной информации

Проверяющий элемент контрольной суммы

Для выполнения контрольной суммы для цифры в регулярном выражении можно использовать проверяющий элемент контрольной суммы. Например, если необходимо создать sit для восьмизначного номера лицензии, где последняя цифра является контрольной суммой, проверенной с помощью вычисления мода 9, настройте алгоритм контрольной суммы следующим образом:

Sum = digit 1 * Weight 1 + digit 2 * weight 2 + digit 3 * weight 3 + digit 4 * weight 4 + digit 5 * weight 5 + digit 6 * weight 6 + digit 7 * weight 7 + digit 8 * weight 8
Mod value = Sum % 9
If Mod value == digit 8
    Account number is valid
If Mod value != digit 8
    Account number is invalid
  1. Определите основной элемент с помощью этого регулярного выражения:

    \d{8}
    
  2. Добавьте проверяющий элемент контрольной суммы.

  3. Добавьте значения веса, разделенные запятыми, позицию проверка цифру и значение мода. Дополнительные сведения об операции Modulo см. в разделе Операция с модулем.

    Примечание.

    Если проверка цифра не является частью вычисления контрольной суммы, используйте 0 в качестве веса для проверка цифры. Например, в предыдущем случае вес 8 будет равен 0, если проверка цифра не будет использоваться для вычисления проверка цифры.

    снимок экрана с настроенным проверятелем контрольной суммы.

Проверяющий элемент даты

Если значение даты, внедренное в регулярное выражение, является частью создаваемого шаблона, можно использовать проверяющий элемент даты , чтобы проверить, соответствует ли это значение вашим критериям. Например, необходимо создать sit для девятизначного идентификационного номера сотрудника. Первые шесть цифр — это дата найма в формате DDMMYY, а последние три — случайные числа. Чтобы убедиться, что первые шесть цифр имеют правильный формат, сделайте следующее:

  1. Определите основной элемент с помощью этого регулярного выражения:

    \d{9}
    
  2. Добавьте проверяющий элемент даты.

  3. Выберите формат даты и начального смещения. Так как строка даты — это первые шесть цифр, смещение равно 0.

    снимок экрана с настроенным проверятелем даты.

Функциональные процессоры в качестве проверяющих элементов

Обработчики функций можно использовать для некоторых наиболее часто используемых SIT в качестве проверяющих элементов. Использование обработчиков функций позволяет определить собственные регулярные выражения, гарантируя, что они проходят дополнительные проверки, необходимые для SIT. Например, Func_India_Aadhar гарантирует, что определенное пользовательское регулярное выражение проходит логику проверки, необходимую для индийского карта Aadhar. Дополнительные сведения о функциях защиты от потери данных, которые можно использовать в качестве проверяющих элементов, см. в разделе Функции типов конфиденциальной информации.

Проверяющий проверка Luhn

Вы можете использовать проверяющий модуль проверка Luhn, если у вас есть пользовательский тип конфиденциальной информации, включающий регулярное выражение, которое должно передавать алгоритм Luhn.

Дополнительные проверки типа конфиденциальной информации

Далее приводятся определения и некоторые примеры доступных дополнительных проверок.

Исключить определенные совпадения. Это проверка позволяет определить ключевые слова, которые следует исключить при обнаружении совпадений для редактимого шаблона. Например, можно исключить образцы номеров кредитных карт, такие как “4111111111111111”, чтобы они не считались настоящими номерами.

Начинается или не начинается с символов. Эта проверка позволяет назначить символы, с которых должны (или не должны) начинаться совпадающие элементы. Например, если шаблон должен искать только номера кредитных карт, начинающиеся с 41, 42 или 43, нажмите Начинается с и добавьте в список 41, 42 и 43 через запятую.

Заканчивается или не заканчивается символами. Эта проверка позволяет назначить символы, которыми должны (или не должны) заканчиваться совпадающие элементы. Например, если ваш код сотрудника не должен заканчиваться на 0 или 1, нажмите Не заканчивается на и добавьте в список 0 и 1 через запятую.

Исключить повторяющиеся символы. Эта проверка позволяет игнорировать все совпадения с одинаковыми цифрами. Например, если в шестизначном коде сотрудника должны быть разные цифры, можно выбрать Исключить повторяющиеся символы и исключить из списка допустимых кодов сотрудника значения 111111, 222222, 333333, 444444, 555555, 666666, 777777, 888888, 999999 и 000000.

Включить или исключить префиксы. Эта проверка позволяет назначить ключевые слова, которые должны (или не должны) присутствовать непосредственно перед совпадающим объектом. В зависимости от выбора объекты с указанными здесь префиксами будут либо выводиться в результатах, либо игнорироваться. Например, если исключить префикс GUID:, любая сущность, перед которым предшествует GUID: , не будет соответствовать.

Включить или исключить суффиксы. Эта проверка позволяет назначить ключевые слова, которые должны (или не должны) присутствовать непосредственно после совпадающего объекта. В зависимости от выбранного значения сущности будут соответствовать или не совпадать, если за ними следуют суффиксы, которые вы здесь включаете. Например, если исключить суффикс :GUID, любой текст, за которым следует :GUID , не будет соответствовать.