Справочник по фильтрам пользовательских типов конфиденциальной информации
В Microsoft Purview можно определить фильтры или другие проверки при создании пользовательского типа конфиденциальной информации (SIT).
Совет
Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.
Описание: позволяет исключить совпадения со всеми цифрами в виде повторяющихся цифр, например 111111111 или 111-111-111.
Определение фильтров:
<Filters id="ssn_filters">
<Filter type="AllDigitsSameFilter"></Filter>
</Filters>
Использование его в пакете правил на уровне сущности:
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85" filters="ssn_filters">
<Pattern confidenceLevel="85">
<IdMatch idRef="Func_ssn" />
</Pattern>
</Entity>
Использование его в пакете правил на уровне шаблона:
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
<Pattern confidenceLevel="85" filters="ssn_filters">
<IdMatch idRef="Func_ssn" />
</Pattern>
</Entity>
Описание. Позволяет определить начальные символы для сущности. Он имеет два варианта: исключить и включить.
Например, чтобы исключить числа, начиная с 0500, 91, 091, 010, в следующем списке:
- 0500-4500-027
- 91564721450
- 91-8523697410
- 700-8956-7844
- 1000-3265-9874
- 0100-7892-3012
можно использовать следующий XML-код:
<Filters id="phone_number_filters_exc">
<Filter type="TextMatchFilter" direction="StartsWith" logic="Exclude" textProcessorId="Keyword_false_positives_sw">
</Filter>
</Filters>
<Keyword id="Keyword_false_positives_sw">
<Group matchStyle="string">
<Term>0500</Term>
<Term>91</Term>
<Term>091</Term>
<Term>0100</Term>
</Group>
</Keyword>
Аналогичным образом, чтобы включить числа, начиная с 0500, 91, 091, 0100, в список, как показано ниже:
- 0500-4500-027
- 91564721450
- 91-8523697410
- 700-8956-7844
- 1000-3265-9874
- 0100-7892-3012
можно использовать следующий XML-код:
<Filters id="phone_filters_inc">
<Filter type="TextMatchFilter" direction="StartsWith" logic="Include" textProcessorId="Keyword_false_positives_sw">
</Filter>
Описание: позволяет определить конечные символы для сущности.
Например, чтобы исключить числа, заканчивающиеся на 0500 91 091, 0100 в списке, как показано ниже:
- 1234567891
- 1234-5678-0091
- 1234.4567.7091
- 1234-8091-4564
можно использовать следующий XML-код:
<Filters id="phone_number_filters_exc">
<Filter type="TextMatchFilter" direction="EndsWith" logic="Exclude" textProcessorId="Keyword_false_positives_sw">
</Filter>
<Keyword id="Keyword_false_positives_sw">
<Group matchStyle="string">
<Term>0500</Term>
<Term>91</Term>
<Term>091</Term>
<Term>0100</Term>
</Group>
</Keyword>
Например, чтобы включить числа, заканчивающиеся на 0500, 91, 091, 0100, в список, как показано ниже:
- 1234567891
- 1234-5678-0091
- 1234.4567.7091
- 1234-8091-4564
Можно использовать следующий XML-код:
<Filters id="phone_filters_inc">
<Filter type="TextMatchFilter" direction=" EndsWith" logic="Include" textProcessorId="Keyword_false_positives_sw">
</Filter>
Описание. Позволяет запретить определенные совпадения, чтобы запретить им активировать правило, например исключить 4111111111111111 из списка допустимых кредитных карта совпадений.
Например, чтобы исключить кредитные карта числа, такие как 4111111111111111 и 3241891031113111 в следующем списке:
- 4485 3647 3952 7352
- 4111111111111111
- 3241891031113111
можно использовать следующий XML-код:
<Filters id="cc_number_filters_exc">
<Filter type="TextMatchFilter" direction="Full" logic="Exclude" textProcessorId="Keyword_false_positives_full">
</Filter>
<Keyword id="Keyword_false_positives_full">
<Group matchStyle="string">
<Term>4111111111111111</Term>
<Term>3241891031113111</Term>
</Group>
</Keyword>
Аналогичным образом, чтобы включить кредитные карта числа, такие как 4111111111111111 и 3241891031113111, в список, подобный следующему:
- 4485 3647 3952 7352
- 4111111111111111
- 3241891031113111
можно использовать следующий XML-код:
<Filters id="cc_filters_inc">
<Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_false_positives_full">
</Filter>
Описание. Позволяет определить предыдущие символы, которые всегда должны быть исключены или включены. Например, если номеру credit карта предшествует "Идентификатор заказа:", то удалите совпадение из допустимых совпадений.
Например, чтобы исключить вхождения телефонных номеров с номером телефона и позвонить мне по строкам перед номером телефона, в списке, как показано ниже:
- Номер телефона 091-8974-653278
- Телефон 45-124576532-123
- 45-124576532-123
можно использовать следующий XML-код:
<Filters id="cc_number_filters_exc">
<Filter type="TextMatchFilter" direction="Prefix" logic="Exclude" textProcessorId="Keyword_false_positives_prefix">
</Filter>
<Keyword id="Keyword_false_positives_prefix">
<Group matchStyle="string">
<Term>phone number</Term>
<Term>call me at</Term>
</Group>
</Keyword>
Аналогичным образом, чтобы включить экземпляры, имеющие кредитные карта и карта строки # перед номером карта кредита, в список, подобный следующему:
- Кредит карта 45-124576532-123
- 45-124576532-123 (это может быть номер телефона)
можно использовать следующий XML-код:
<Filters id="cc_filters_inc">
<Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_true_positives_prefix">
</Filter>
<Keyword id="Keyword_true_positives_prefix">
<Group matchStyle="string">
<Term>credit card</Term>
<Term>card #</Term>
</Group>
</Keyword
Описание. Позволяет определить следующие символы, которые всегда должны быть исключены или включены. Например, если за номером карта кредита следует значение "/xuid", удалите совпадение из допустимых совпадений.
Например, в верхней части исключаются вхождения, если в списке, как показано ниже, есть еще пять экземпляров с четырьмя цифрами:
- 1234-5678-9321 4500 9870 6321 48925566
- 1234-5678-9321
можно использовать следующий XML-код:
<Filters id="cc_number_filters_exc">
<Filter type="TextMatchFilter" direction="Prefix" logic="Exclude" textProcessorId="Regex_false_positives_suffix">
</Filter>
<Regexid="Regex_false_positives_suffix">(\d{4}){5,}</Regex>
Вы также можете исключить вхождения, если за ними следует /xuidsuffix, как в этом списке:
- 1234-5678-9321 /xuid
- 1234-5678-9321
вы можете использовать следующий XML-код:
<Filters id="cc_number_filters_exc">
<Filter type="TextMatchFilter" direction="Prefix" logic="Exclude" textProcessorId="Keyword_false_positives_suffix">
</Filter>
<Keyword id="Keyword_false_positives_suffix">
<Group matchStyle="string">
<Term>/xuid</Term>
</Group>
</Keyword>
Аналогичным образом, чтобы включить вхождение только в том случае, если за ним следует cvv или истекает срок действия, например два в этом списке:
- 45-124576532-123
- 45-124576532-123 cvv 966
- 45-124576532-123 истекает 23/03
вы можете использовать следующий XML-код:
<Filters id="cc_filters_inc">
<Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_true_positives_suffix">
</Filter>
<Keyword id="Keyword_true_positives_suffix">
<Group matchStyle="string">
<Term>cvv</Term>
<Term>expires</Term>
</Group>
</Keyword>
Фильтры можно определить для всего SIT или по шаблону. Ниже приведены некоторые примеры.
Фильтры в сущности — охватывают все дочерние шаблоны
Фильтры будут применяться ко всем экземплярам, классифицированным по любому из шаблонов в этом типе сущности или конфиденциальной информации.
<Entity id="6443b88f-2808-482a-8e1a-3ae5026645e1" patternsProximity="300" recommendedConfidence="85" filters="CompositeFiltersAtEntityLevel">
<Pattern confidenceLevel="85">
<IdMatch idRef="Regex_denmark_id" />
</Pattern>
</Entity>
Фильтрует только на уровне шаблона.
Фильтр будет применяться только к экземплярам, соответствующим шаблону.
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
<Pattern confidenceLevel="85" filters="CompositeFiltersAtPattern">
<IdMatch idRef="Keyword_cc_verification" />
</Pattern>
</Entity>
На уровне типа конфиденциальной информации с дополнительным фильтром по некоторым шаблонам этой сущности
Фильтры по сущности и шаблону
Фильтры будут применяться ко всем экземплярам, классифицированным по любому из шаблонов в этом типе сущности или конфиденциальной информации. Фильтр на уровне шаблона будет фильтровать экземпляры, соответствующие данному шаблону.
<Entity id="6443b88f-2808-482a-8e1a-3ae5026645e1" patternsProximity="300" recommendedConfidence="85" filters="CompositeFiltersAtEntityLevel">
<Pattern confidenceLevel="85" filters="CompositeFiltersAtPattern">
<IdMatch idRef="Regex_denmark_id" />
</Pattern>
</Entity>