Прочитать на английском

Поделиться через


Справочник по фильтрам пользовательских типов конфиденциальной информации

В Microsoft Purview можно определить фильтры или другие проверки при создании пользовательского типа конфиденциальной информации (SIT).

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Список поддерживаемых фильтров и вариантов использования

AllDigitsSame Exclude

Описание: позволяет исключить совпадения со всеми цифрами в виде повторяющихся цифр, например 111111111 или 111-111-111.

Определение фильтров:

<Filters id="ssn_filters">
    <Filter type="AllDigitsSameFilter"></Filter>
</Filters>

Использование его в пакете правил на уровне сущности:

<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85"  filters="ssn_filters">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_ssn" />
      </Pattern>
</Entity>

Использование его в пакете правил на уровне шаблона:

<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85"  filters="ssn_filters">
        <IdMatch idRef="Func_ssn" />
      </Pattern>
</Entity>

TextMatchFilter StartsWith

Описание. Позволяет определить начальные символы для сущности. Он имеет два варианта: исключить и включить.

Например, чтобы исключить числа, начиная с 0500, 91, 091, 010, в следующем списке:

  • 0500-4500-027
  • 91564721450
  • 91-8523697410
  • 700-8956-7844
  • 1000-3265-9874
  • 0100-7892-3012

можно использовать следующий XML-код:

<Filters id="phone_number_filters_exc">
    <Filter type="TextMatchFilter" direction="StartsWith" logic="Exclude" textProcessorId="Keyword_false_positives_sw">
</Filter>
</Filters>

  <Keyword id="Keyword_false_positives_sw">
    <Group matchStyle="string">
      <Term>0500</Term>
      <Term>91</Term>
      <Term>091</Term>
      <Term>0100</Term>
    </Group>
  </Keyword>

Аналогичным образом, чтобы включить числа, начиная с 0500, 91, 091, 0100, в список, как показано ниже:

  • 0500-4500-027
  • 91564721450
  • 91-8523697410
  • 700-8956-7844
  • 1000-3265-9874
  • 0100-7892-3012

можно использовать следующий XML-код:

<Filters id="phone_filters_inc">
    <Filter type="TextMatchFilter" direction="StartsWith" logic="Include" textProcessorId="Keyword_false_positives_sw">
</Filter>

TextMatchFilter EndsWith

Описание: позволяет определить конечные символы для сущности.

Например, чтобы исключить числа, заканчивающиеся на 0500 91 091, 0100 в списке, как показано ниже:

  • 1234567891
  • 1234-5678-0091
  • 1234.4567.7091
  • 1234-8091-4564

можно использовать следующий XML-код:

<Filters id="phone_number_filters_exc">
    <Filter type="TextMatchFilter" direction="EndsWith" logic="Exclude" textProcessorId="Keyword_false_positives_sw">
</Filter>

  <Keyword id="Keyword_false_positives_sw">
    <Group matchStyle="string">
      <Term>0500</Term>
      <Term>91</Term>
      <Term>091</Term>
      <Term>0100</Term>
    </Group>
  </Keyword>

Например, чтобы включить числа, заканчивающиеся на 0500, 91, 091, 0100, в список, как показано ниже:

  • 1234567891
  • 1234-5678-0091
  • 1234.4567.7091
  • 1234-8091-4564

Можно использовать следующий XML-код:

<Filters id="phone_filters_inc">
    <Filter type="TextMatchFilter" direction=" EndsWith" logic="Include" textProcessorId="Keyword_false_positives_sw">
</Filter>

TextMatchFilter Full

Описание. Позволяет запретить определенные совпадения, чтобы запретить им активировать правило, например исключить 4111111111111111 из списка допустимых кредитных карта совпадений.

Например, чтобы исключить кредитные карта числа, такие как 4111111111111111 и 3241891031113111 в следующем списке:

  • 4485 3647 3952 7352
  • 4111111111111111
  • 3241891031113111

можно использовать следующий XML-код:

<Filters id="cc_number_filters_exc">
    <Filter type="TextMatchFilter" direction="Full" logic="Exclude" textProcessorId="Keyword_false_positives_full">
</Filter>

  <Keyword id="Keyword_false_positives_full">
    <Group matchStyle="string">
      <Term>4111111111111111</Term>
      <Term>3241891031113111</Term>
    </Group>
  </Keyword>

Аналогичным образом, чтобы включить кредитные карта числа, такие как 4111111111111111 и 3241891031113111, в список, подобный следующему:

  • 4485 3647 3952 7352
  • 4111111111111111
  • 3241891031113111

можно использовать следующий XML-код:

<Filters id="cc_filters_inc">
    <Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_false_positives_full">
</Filter>

Префикс TextMatchFilter

Описание. Позволяет определить предыдущие символы, которые всегда должны быть исключены или включены. Например, если номеру credit карта предшествует "Идентификатор заказа:", то удалите совпадение из допустимых совпадений.

Например, чтобы исключить вхождения телефонных номеров с номером телефона и позвонить мне по строкам перед номером телефона, в списке, как показано ниже:

  • Номер телефона 091-8974-653278
  • Телефон 45-124576532-123
  • 45-124576532-123

можно использовать следующий XML-код:

<Filters id="cc_number_filters_exc">
    <Filter type="TextMatchFilter" direction="Prefix" logic="Exclude" textProcessorId="Keyword_false_positives_prefix">
</Filter>
  <Keyword id="Keyword_false_positives_prefix">
    <Group matchStyle="string">
      <Term>phone number</Term>
      <Term>call me at</Term>
    </Group>
  </Keyword>

Аналогичным образом, чтобы включить экземпляры, имеющие кредитные карта и карта строки # перед номером карта кредита, в список, подобный следующему:

  • Кредит карта 45-124576532-123
  • 45-124576532-123 (это может быть номер телефона)

можно использовать следующий XML-код:

<Filters id="cc_filters_inc">
    <Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_true_positives_prefix">
</Filter>

  <Keyword id="Keyword_true_positives_prefix">
    <Group matchStyle="string">
      <Term>credit card</Term>
      <Term>card #</Term>
    </Group>
  </Keyword

Суффикс TextMatchFilter

Описание. Позволяет определить следующие символы, которые всегда должны быть исключены или включены. Например, если за номером карта кредита следует значение "/xuid", удалите совпадение из допустимых совпадений.

Например, в верхней части исключаются вхождения, если в списке, как показано ниже, есть еще пять экземпляров с четырьмя цифрами:

  • 1234-5678-9321 4500 9870 6321 48925566
  • 1234-5678-9321

можно использовать следующий XML-код:

<Filters id="cc_number_filters_exc">
    <Filter type="TextMatchFilter" direction="Prefix" logic="Exclude" textProcessorId="Regex_false_positives_suffix">
</Filter>

  <Regexid="Regex_false_positives_suffix">(\d{4}){5,}</Regex>

Вы также можете исключить вхождения, если за ними следует /xuidsuffix, как в этом списке:

  • 1234-5678-9321 /xuid
  • 1234-5678-9321

вы можете использовать следующий XML-код:

<Filters id="cc_number_filters_exc">
    <Filter type="TextMatchFilter" direction="Prefix" logic="Exclude" textProcessorId="Keyword_false_positives_suffix">
</Filter>

  <Keyword id="Keyword_false_positives_suffix">
    <Group matchStyle="string">
      <Term>/xuid</Term>
    </Group>
  </Keyword>

Аналогичным образом, чтобы включить вхождение только в том случае, если за ним следует cvv или истекает срок действия, например два в этом списке:

  • 45-124576532-123
  • 45-124576532-123 cvv 966
  • 45-124576532-123 истекает 23/03

вы можете использовать следующий XML-код:

<Filters id="cc_filters_inc">
    <Filter type="TextMatchFilter" direction="Full" logic="Include" textProcessorId="Keyword_true_positives_suffix">
</Filter>

  <Keyword id="Keyword_true_positives_suffix">
    <Group matchStyle="string">
      <Term>cvv</Term>
      <Term>expires</Term>
    </Group>
  </Keyword>

Использование фильтров в пакетах правил

Фильтры можно определить для всего SIT или по шаблону. Ниже приведены некоторые примеры.

На уровне типа конфиденциальной информации

Фильтры в сущности — охватывают все дочерние шаблоны

Фильтры будут применяться ко всем экземплярам, классифицированным по любому из шаблонов в этом типе сущности или конфиденциальной информации.

<Entity id="6443b88f-2808-482a-8e1a-3ae5026645e1" patternsProximity="300" recommendedConfidence="85" filters="CompositeFiltersAtEntityLevel">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_denmark_id" />
      </Pattern>
</Entity>

На уровне типа конфиденциальной информации в отдельном шаблоне

Фильтрует только на уровне шаблона.

Фильтр будет применяться только к экземплярам, соответствующим шаблону.

<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85"  filters="CompositeFiltersAtPattern">
        <IdMatch idRef="Keyword_cc_verification" />
      </Pattern>
</Entity>

На уровне типа конфиденциальной информации с дополнительным фильтром по некоторым шаблонам этой сущности

Фильтры по сущности и шаблону

Фильтры будут применяться ко всем экземплярам, классифицированным по любому из шаблонов в этом типе сущности или конфиденциальной информации. Фильтр на уровне шаблона будет фильтровать экземпляры, соответствующие данному шаблону.

<Entity id="6443b88f-2808-482a-8e1a-3ae5026645e1" patternsProximity="300" recommendedConfidence="85" filters="CompositeFiltersAtEntityLevel">
      <Pattern confidenceLevel="85" filters="CompositeFiltersAtPattern">
        <IdMatch idRef="Regex_denmark_id" />
      </Pattern>
</Entity>

Дополнительная информация